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内 容 提 要 


， 布 … 包 戴 … @ 昌 … 村 … II. QD 


了 解数 据 结构 与 算法 是 透彻 理解 计算 机 科学 的 前 提 。 随 着 Python 日 益 广泛 的 应 用 ，Python 程序 员 需 要 


实现 与 传统 的 面向 对 象 编程 语言 相似 的 数据 结构 与 算法 。 


汇聚 了 作者 多 生 
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] Python 描述 数据 结构 与 算法 的 开山 之 作 ， 





的 实战 经 验 ， 向 读者 透彻 讲解 在 Python 环境 











本 书 适 合 甩 


fF 有 Python 程序 员 阅 读 。 








， 如 何 通过 一 系列 存储 机 
算法 。 通 过 本 书 ， 读 者 将 深刻 理解 Python 数据 结构 、 递 归 、 搜索 、 排序 、 树 与 图 的 应 用 ， 
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致 学 生 


既然 你 已 经 开始 阅读 本 书 ， 那 么 必定 对 计算 机 科学 感 兴趣 。 你 可 能 也 对 Python 这 门 编程 语 
言 感 兴趣 ,并 且 已 经 通过 之 前 的 课程 或 自学 有 了 一 些 编程 经 验 。 不 论 是 何 种 情况 ,你 肯定 都 希望 
学 习 更 多 知识 。 

本 书 将 介绍 计算 机 科学 ， 也 会 介绍 Python。 然 而 ， 书 中 的 内 容 并 不 仅仅 局 限于 这 两 个 方面 。 
学 习 数 据 结构 与 算法 对 理解 计算 机 科学 的 本 质 非常 关键 。 

学 习 计 算 机 科学 与 掌握 其 他 高 难度 学 科 没什么 不 同 。 成 功 的 唯一 途径 便 是 循序 渐进 地 学 习 其 
中 的 核心 思想 。 刚 开始 接触 计算 机 科学 的 人 , 需要 多 多 练习 来 加 深 理解 ， 从 而 为 学 习 更 复杂 的 内 
容 做 好 准备 。 此 外 ， 初 学 者 需要 建立 起 自信 心 。 

本 书 用 作 数 据 结构 与 算法 的 人 门 课 的 教材 。 数 据 结构 与 算法 通常 是 计算 机 科学 专业 的 第 二 门 
课程 ， 比 第 一 门 课程 更 深入 。 但 是 本 书 的 读者 对 象 仍然 是 初学 者 , 很 可 能 还 在 第 一 门 课程 所 教 的 
基本 思想 和 方法 中 挣扎 ， 但 已 经 准备 好 进一步 探索 这 一 领域 并 且 进 一 步 练 习 如 何 解决 问题 。 

如 前 所 述 ， 本 书 将 介绍 计算 机 科学 。 它 既 会 介绍 抽象 数据 类 型 及 数据 结构 ， 也 会 介绍 如 何 编 
写 算法 和 解决 问题 。 你 会 学 习 一 系列 的 数据 结构 ,并 且 解 决 各 种 经 典 问 题 。 随 着 学 习 的 深入 ,你 
将 反复 应 用 在 各 章 中 掌握 的 工具 与 技术 。 















































































































































致 教师 


许多 学 生 在 学 到 这 个 阶段 时 会 发 现 , 计算 机 科学 除了 编程 以 外 还 有 很 多 内 容 。 数据 结构 与 算 
法 可 以 独立 于 编程 来 学 习 和 理解 。 
本 书 假定 学 生 已 经 学 过 计算 机 科学 的 入 门 课程 ， 但 入 门 课 程 不 一 定 是 用 Python 讲解 的 。 他 
们 理解 基本 的 结构 体 ， 比 如 分 支 、 和 迭代 以 及 函数 定义 ， 也 接触 过 面向 对 象 编程 ， 并 且 能 够 创建 和 
使 用 简单 的 类 。 同 时 ， 学 生 也 能 够 理解 Python 的 基础 数据 结构 ， 比 如 序列 ( 列表 和 字符 串 ) 以 
及 字典 。 



















































































本 书 有 三 大 特点 : 





基本 的 数据 结构 与 算法 ; 














口 通过 简单 易 读 的 文字 而 不 引入 太 多 编程 语法 ， 重 点 关注 如 何 解 决 问题 ， 从 而 向 学 生 介绍 


口 较 早 介绍 基于 大 O 记 法 的 算法 分 析 ， 并 且 通 篇 运用 ; 
口 使 用 Python 讲解 ， 以 促使 初学 者 能 够 使 用 和 掌握 数据 结构 与 算法 。 








学 生 将 首先 学 习 线性 数据 结构 ， 包 括 栈 、 队 列 、 双 端 队列 以 及 列表 。 我 们 用 Python 列表 以 
及 链表 实现 这 些 数据 结构 。 然 后 学 习 与 树 有 关 的 非 线性 数据 结构 ， 了 解 连接 节点 和 引用 结构 〈 链 
表 ) 等 一 系列 技术 。 最 后 ， 学 生 将 通过 运用 链 式 结构 、 链 表 以 及 Python 字典 的 实现 ， 学 习 图 的 
相关 知识 。 对 于 每 一 种 结构 ， 本 书 都 尽力 在 使 用 Python 提供 的 内 建 数 据 类 型 的 同时 展现 众多 的 


实现 技巧 。 这 种 讲法 在 向 学 生 揭 示 各 种 主要 实现 方法 的 同时 ， 也 强调 Python 的 易 用 性 。 





























Python 是 一 门 非常 适合 于 讲解 算法 的 i 





看 言 ， 语 法 干净 简洁 , 用 户 环境 直观 ,基本 的 数据 类 型 


























十 分 强大 和 易 用 。 其 交互 性 在 不 需要 额外 编写 驱动 函数 的 情况 下 为 测试 数据 结构 单元 提供 了 直观 
环境 。 而且， Python 为 算法 提供 了 教科 书 式 的 表示 法 ,基本 上 不 需要 再 用 伪 代 码 。 这 一 特性 有 助 
于 通过 数据 结构 与 算法 来 描述 众多 与 之 有 关 、 相 当 有 趣 的 现代 问题 。 


我 们 相信 ,对 于 初学 者 来 说 ,投入 时 间 学 习 与 算法 和 数据 结构 相关 的 基本 思想 是 非常 有 益 的 。 





























我 们 也 相信 , Python 是 一 门 教授 初学 者 入 1 
编程 概念 ， 这 会 阻碍 他 们 掌握 真正 需要 的 



































了] 的 优秀 语言 。 其 他 许多 语言 要 求学 生 学 习 非 常 高 级 的 
基础 知识 ， 从 而 可 能 导致 失败 ， 而 这 样 的 失败 并 不 是 























计算 机 科学 本 身 造成 的 , 而 是 由 于 所 使 用 的 语言 不 当 。 我 们 的 目标 是 提供 一 本 教科 书 , 量体裁衣 
般 地 聚焦 于 他 们 需要 掌握 的 内 容 , 以 他 们 能 理解 的 方式 编写 , 创造 和 发 展 一 个 有 助 于 他 们 成 功 的 





环境 。 


























本 书 紧 紧 地 围绕 着 运用 经 典 数据 结构 和 技术 来 解决 问题 ,下面 的 组 织 结构 图 展示 了 充分 利用 


本 书 的 不 同方 式 。 











第 2 章 
算法 分 析 


















































第 8 章 附加 内 容 


d 
(We 





第 1 章 做 一 些 背 景 知识 的 准备 ,我 们 来 复习 一 下 计算 机 科学 、 问 题解 决 、 面 向 对 象 编程 以 及 
Python。 基 础 扎实 的 学 生 可 以 跳 过 第 1 章 ， 直 接 学 习 第 2 章 。 不 过 ， 正 所 谓 温 故 而 知 新 ,适当 的 
复习 和 回顾 必然 是 值得 的 。 

第 2 章 介绍 算法 分 析 的 内 在 思想 , 重点 讲解 大 O 记 法 , 还 将 分 析 本 书 一 直 使 用 的 重要 Python 
数据 结构 。 这 可 以 帮助 学 生理 解 如 何 权衡 各 种 抽象 数据 类 型 的 不 同 实现 。 第 2 章 也 包含 了 在 运行 
时 使 用 的 Python 原生 类 型 的 实验 测量 例子 。 

第 3~7 章 全 面 介绍 在 经 典 计算 机 科学 问题 中 出 现 的 数据 结构 与 算法 。 尽 管 在 阅读 顺序 上 并 无 
严格 要 求 ,但 是 许多 话题 之 间 都 存在 一 定 的 依赖 关系 ,所 以 应 该 按照 本 书 的 顺序 学 习 。 比 如 , 第 
3 章 介绍 栈 ， 第 4 章 利 用 栈 解释 递归 ， 第 5 章 利用 递归 实现 二 分 搜索 。 

第 8 章 是 选 学 内 容 , 包含 彼此 独立 的 几 节 。 每 一 他 都 与 之 前 的 某 一 章 有 关 。 正 如 前 面 的 组 乡 
结构 图 所 示 , 你 既 可 以 在 学 习 完 第 7 章 以 后 再 一 起 学 习 第 8 章 中 的 各 节 内 容 , 也 可 以 把 它们 与 对 应 
的 那 一 章 放 在 一 起 学 习 。 例 如 , 希望 更 早 介绍 数组 的 教师 , 可 以 在 讲 完 第 3 章 以 后 直接 跳 到 8.2 节 。 
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新 版 改进 


口 所 有 的 代码 都 用 Python 3.2 写成 。 

口 第 1 章 介绍 Python 的 集合 以 及 异常 处 理 。 
口 不 再 使 用 第 三 方 绘图 包 。 新 版 中 的 所 有 图 形 都 通过 原生 的 turtle 模块 绘制 。 

口 新 加 的 第 2 章 着 重 讲解 算法 分 析 。 此 外 ， 这 一 章 还 包括 对 全 书 出 现 的 关键 Python 数据 结 
构 的 分 析 。 

口 第 3 章 新 增 了 关于 链表 实现 的 一 节 。 

口 将 “动态 规划 ”一 节 移 到 了 第 4 章 的 最 后 。 

口 更 关注 图 递归 算法 ， 包 括 递归 树 绘制 以 及 递归 迷宫 搜索 程序 。 

口 所 有 的 数据 结构 源 代码 都 被 放 在 一 个 Python 包 中 ， 方 便 学 生 在 完成 作业 时 使 用 。 

口 新 版 包含 各 章 例子 的 完整 源 代码 ， 从 而 避免 了 从 各 处 复制 代码 的 麻烦 。 

口 第 6 章 改进 了 二 又 搜索 树 。 

口 第 6 章 新 增 了 关于 平衡 二 又 树 的 一 节 。 

口 第 8 章 介绍 C 风格 的 数组 和 数组 管理 。 
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1.1 本 章 目标 


口 复习 计算 机 科学 、 编 程 以 及 解决 问题 方面 的 知识 。 
口 理解 抽象 这 一 概念 及 其 在 解决 问题 的 过 程 中 所 发 挥 的 作用 。 
o 理解 并 建立 抽象 数据 类 型 的 概念 。 

口 复习 Python。 





























1.2 入 门 


自从 第 一 台 利 用 转 接线 和 开关 来 传递 计算 指令 的 电子 计算 机 诞生 以 来 , 人 们 对 编程 的 认识 历 
经 了 多 次 变化 。 与 社会 生活 的 其 他 许多 方面 一 样 , 计算 机 技术 的 变革 为 计算 机 科学 家 提供 了 越 来 
越 多 的 工具 和 平台 去 施展 他 们 的 才能 。 高 效 的 处 理 器 .高速 网 络 以 及 大 容量 内 存 等 一 系列 新 技术 ， 
要 求 计 算 机 科学 家 掌握 更 多 复杂 的 知识 。 然 而 , 在 这 一 系列 快速 的 变革 之 中 , 仍 有 一 些 基 本 原则 
始终 保持 不 变 。 计 算 机 科学 被 认为 是 一 门 利 用 计算 机 来 解决 问题 的 学 科 。 

你 肯定 在 学 习 解 决 问题 的 基本 方法 上 投入 过 大 量 的 时 间 , 并 且 相信 自己 拥有 根据 问题 描述 构 
建 解决 方案 的 能 力 。 你 肯定 也 体会 到 了 编写 计算 机 程序 的 困难 之 处 。 大 型 难题 及 其 解决 方案 的 复 
杂 性 往往 会 掩盖 问题 解决 过 程 的 核心 思想 。 

本 章 将 为 后 续 各 章 重 点 解释 两 个 重要 的 话题 。 首先, 本 章 会 复习 计算 机 科学 以 及 数据 结构 与 
算法 的 研究 必须 符合 的 框架 , 尤其 是 学 习 这 些 内 容 的 原因 以 及 为 什么 说 理解 它们 有 助 于 更 好 地 解 
决 问题 。 其 次 ， 本 章 会 复习 Python。 尽 管 不 会 提供 完整 、 详 尽 的 Python 参考 资料 ,但 是 会 针对 
阅读 后 续 各 章 所 需 的 基础 知识 及 基本 思想 ， 给 出 示例 以 及 相应 的 解释 。 

































































1.3 何谓 计算 机 科学 


要 定义 计算 机 科学 ,通常 十 分 困难 ,这 也 许 是 因为 其 中 的 “计算 机 ”一 词 。 你 可 能 已 经 意识 
到 , 计算 机 科学 并 不 仅 是 研究 计算 机 本 身 。 尽 管 计算 机 在 这 一 学 科 中 是 非常 重要 的 工具 , 但 也 仅 












































仅 只 是 工具 而 已 。 

计算 机 科学 的 研究 对 象 是 问题 、 解 决 问题 的 过 程 ， 以 及 通过 该 过 程 得 到 的 解决 方案 。 给 定 一 
个 问题 ,计算 机 科学 家 的 目标 是 开发 一 个 能 够 逐步 解决 该 问题 的 算法 。 算 法 是 具有 有 限 步 又 的 过 
程 ， 依 照 这 个 过 程 便 能 解决 问题 。 因 此 ， 算 法 就 是 解决 方案 。 

可 以 认为 计算 机 科学 就 是 研究 算法 的 学 科 。 但 是 必须 注意 ， 某 些 问题 并 没有 解决 方案 。 尽 管 
这 一 话题 已 经 超出 了 本 书 讨论 的 范畴 , 但 是 对 于 学 习 计算 机 科学 的 人 来 说 , 认 清 这 一 事实 非常 重 
要 。 结 合 上 述 两 类 问题 ， 可 以 将 计算 机 科学 更 完善 地 定义 为 : 研究 问题 及 其 解决 方案 ， 以 及 研究 
目前 无 解 的 问题 的 学 科 。 

在 描述 问题 及 其 解决 方案 时 ， 经 常用 到 “可 计算 ”一 词 。 若 存在 能 够 解决 某 个 问题 的 算法 ， 
那么 该 问题 便 是 可 计算 的 。 因此 , 计算 机 科学 也 可 以 被 定义 为 : 研究 可 计算 以 及 不 可 计算 的 问题 ， 
即 研 究 算法 的 存在 性 以 及 不 存在 性 。 在 上 述 任意 一 种 定义 中 ,“ 计 算 机 ”一 词 都 没有 出 现 。 解 决 
方案 本 身 是 独立 于 计算 机 的 。 

在 研究 问题 解决 过 程 的 同时 ,计算 机 科学 也 研究 抽象 。 抽 象 思维 使 得 我 们 能 分 别 从 逻辑 视角 
和 物理 视角 来 看 待 问题 及 其 解决 方案 。 举 一 个 常见 的 例子 。 

试想 你 每 天 开车 去 上 学 或 上 班 。 作 为 车 的 使 用 者 ， 你 在 驾驶 时 会 与 它 有 一 系列 的 交互 : 坐 进 
车 里 , 插入 钥匙 ， 启 动 发 动机 ， 换 挡 ， 刹车， 加 速 以 及 操作 方向 盘 。 从 抽象 的 角度 来 看 ， 这 是 从 
逻辑 视角 来 看 待 这 辆 车 , 你 在 使 用 由 汽车 设计 者 提供 的 功能 来 将 自己 从 某 个 地 方 运送 到 另 一 个 地 
方 。 这 些 功 能 有 时 候 也 被 称 作 接 口 。 

另 一 方面 , 修 车 工 看 待 车 辆 的 角度 与 司机 鹤 然 不 同 。 他 不 仅 需要 知道 如 何 鸭 驶 ， 而 且 更 需要 
知道 实现 汽车 功能 的 所 有 细节 : 发 动机 如 何 工作 ,变速 器 如 何 换 挡 ， 如 何 控制 温度 ， 等 等 。 这 就 
是 所 谓 的 物理 视角 ， 即 看 到 表面 之 下 的 实现 细节 。 

使 用 计算 机 也 是 如 此 。 大 多 数 人 用 计算 机 来 写 文档 、 收 发 邮件 、 浏 览 网 页 、 听 音乐 、 存 储 图 
像 以 及 打 游 戏 , 但 他 们 并 不 需要 了 解 这 些 功 能 的 实现 细节 。 大 家 都 是 从 逻辑 视角 或 者 使 用 者 的 角 
度 来 看 待 计算 机 。 计 算 机 科学 家 、 程 序 员 、 技 术 支 持 人 员 以 及 系统 管理 员 则 从 另 一 个 角度 来 看 待 
计算 机 。 他 们 必须 知道 操作 系统 的 原理 、 网 络 协议 的 配置 , 以 及 如 何 编写 各 种 脚本 来 控制 计算 机 。 
他 们 必须 能 够 控制 用 户 不 需要 了 解 的 底层 细节 。 

上 面 两 个 例子 的 共同 点 在 于 ,抽象 的 用 户 (或 称 客户 ) 只 需要 知道 接口 是 如 何 工作 的 ， 而 并 
不 需要 知道 实现 细节 。 这 些 接口 是 用 户 用 于 与 底层 复杂 的 实现 进行 交互 的 方式 。 下 面 是 抽象 的 男 
一 个 例子 ,来 看 看 Python 的 math 模块 。 一 旦 导入 这 一 模块 ， 便 可 以 进行 如 下 的 计算 。 


>>> import math 
> matlysgqrt (le6) 
4.0 

ek 


这 是 一 个 过 程 抽 象 的 例子 。 我 们 并 不 需要 知道 平方 根 究 竞 是 如 何 计算 出 来 的 , 而 只 需要 知道 
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计算 平方 根 的 函数 名 是 什么 以 及 如 何 使 用 它 。 只 要 正确 地 导入 模块 , 便 可 以 认为 这 个 函数 会 返回 
正确 的 结果 。 由 于 其 他 人 已 经 实现 了 平方 根 问题 的 解决 方案 , 因此 我 们 只 需要 知道 如 何 使 用 该 孙 
数 即 可 。 这 有 时 候 也 被 称 为 过 程 的 “ 黑 盒 ”视角 。 我 们 仅 需要 描述 接口 : 函数 名 、 所 需 参数 ， 以 
及 返回 值 。 所 有 的 计算 细节 都 被 隐藏 了 起 来 ， 如 图 1-1 所 示 。 








n sqrt() n 的 平方 根 








图 1-1 过 程 抽象 














1.3.1 何谓 编程 


编程 是 指 通过 编程 语言 将 算法 编码 以 使 其 能 被 计算 机 执行 的 过 程 。 尽 管 有 众多 的 编程 语言 和 
不 同类 型 的 计算 机 ， 但 是 首先 得 有 一 个 解决 问题 的 算法 。 如 果 没 有 算法 ， 就 不 会 有 程序 。 

计算 机 科学 的 研究 对 象 并 不 是 编程 。 但 是 , 编程 是 计算 机 科学 家 所 做 工作 的 一 个 重要 组 成 部 
分 。 通常 ,编程 就 是 为 解决 方案 创造 表达 方式 。 因 此 ,编程 语言 对 算法 的 表达 以 及 创造 程序 的 过 
程 是 这 一 学 科 的 基础 。 
通过 定义 表达 问题 实例 所 需 的 数据 , 以 及 得 到 预期 结果 所 需 的 计算 步骤 , 算法 描述 出 了 问题 
的 解决 方案 。 编 程 语言 必须 提供 一 种 标记 方式 ， 用 于 表达 过 程 和 数据 。 为 此 ,编程 语言 提供 了 众 
多 的 控制 语句 和 数据 类 型 。 

控制 语句 使 算法 步骤 能 够 以 一 种 方便 且 明 确 的 方式 表达 出 来 算法 至 少 需 要 能 够 进行 顺序 执 
行 、 决 策 分 文 、 循 环 友 代 的 控制 语句 。 只 要 一 种 编程 语言 能 够 提供 这 些 基本 的 控制 语句 ， 它 就 能 
够 被 用 于 描述 算法 。 

计算 机 中 的 所 有 数据 实例 均 由 二 进 制 字符 串 来 表达 。 为 了 赋予 这 些 数据 实际 的 意义 ,必须 要 
有 数据 类 型 。 数 据 类 型 能 够 帮助 我 们 解读 二 进 制 数据 的 含义 ,从 而 使 我 们 能 从 待 解决 问题 的 角度 
来 看 待 数据 。 这 些 内 建 的 底层 数据 类 型 ( 又 称 原生 数据 类 型 ) 提供 了 算法 开发 的 基本 单元 。 

举例 来 说 , 大 部 分 编程 语言 都 为 整数 提供 了 相应 的 数据 类 型 。 根 据 整 数 ( 如 23、654 以 及 -19 ) 
的 常见 定义 , 计算 机 内 存 中 的 二 进 制 字 符 串 可 以 被 理解 成 整数 。 除 此 以 外 ,数据 类 型 也 描述 了 该 
类 数据 能 参与 的 所 有 和 运算。 对 于 整数 来 说 ， 就 有 加 减 乘 除 等 常见 运算 。 并 且 ， 对 于 数值 类 型 的 数 
据 ， 以 上 运算 均 成 立 。 

我 们 经 常 遇 到 的 困难 是 , 问题 及 其 解决 方案 都 过 于 复杂 。 尽管 由 编程 语言 提供 的 简单 的 控制 
语句 和 数据 类 型 能 够 表达 复杂 的 解决 方案 , 但 它们 在 解决 问题 的 过 程 中 仍然 存在 不 足 。 因此, 我 
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们 需要 想 办 法 控制 复杂 度 以 利于 找到 解决 方案 。 


1.3.2 为何 学 习 数据 结构 及 抽象 数据 类 型 


为 了 控制 问题 及 其 求解 过 程 的 复杂 度 , 计算 机 科学 家 利用 抽象 来 帮助 自己 专注 于 全 局 , 从 而 
避免 迷失 在 众多 细节 中 。 通 过 对 问题 进行 建 模 , 可 以 更 高 效 地 解决 问题 。 模 型 可 以 帮助 计算 机 科 
学 家 更 一 致 地 描述 算法 要 用 到 的 数据 。 

如 前 所 述 ， 过 程 抽象 将 功能 的 实现 细节 隐藏 起 来 ， 从 而 使 用 户 能 从 更 高 的 视角 来 看 待 功 能 。 
数据 抽象 的 基本 思想 与 此 类 似 。 抽 象 数据 类 型 ( 有 时 简称 为 ADT ) 从 逻辑 上 描述 了 如 何 看 待 数 
据 及 其 对 应 运算 而 无 须 考虑 具体 实现 。 这 意味 着 我 们 仅 需 要 关心 数据 代表 了 什么 ,而 可 以 忽略 它 
们 的 构建 方式 。 通 过 这 样 的 抽象 , 我 们 对 数据 进行 了 一 层 封装 ,其 基本 思想 是 封装 具体 的 实现 细 
节 ， 使 它们 对 用 户 不 可 见 ， 这 被 称 为 信息 隐藏 。 

图 1-2 展示 了 抽象 数据 类 型 及 其 原理 。 用 户 通过 利用 抽象 数据 类 型 提供 的 操作 来 与 接口 交互 。 
抽象 数据 类 型 是 与 用 户 交 互 的 外 壳 。 真 正 的 实现 则 隐藏 在 内 部 。 用 户 并 不 需要 关心 各 种 实现 细节 。 

用 户 



















































































接口 


操作 





图 1-2 ”抽象 数据 类 型 


抽象 数据 类 型 的 实现 常 被 称 为 数据 结构 , 这 需要 我 们 通过 编程 语言 的 语法 结构 和 原生 数据 类 
型 从 物理 视角 看 待 数据 。 正如 之 前 讨论 的 , 分 成 这 两 种 不 同 的 视角 有 助 于 为 问题 定义 复杂 的 数据 
模型 ， 而 无 须 考虑 模型 的 实现 细节 。 这 便 提 供 了 一 个 独立 于 实现 的 数据 视角 。 由 于 实现 抽象 数据 
类 型 通常 会 有 很 多 种 方法 , 因此 独立 于 实现 的 数据 视角 使 程序 员 能 够 改变 实现 细节 而 不 影响 用 户 
与 数据 的 实际 交互 。 用 户 能 够 始终 专注 于 解决 问题 。 












































1.3.3 ”为 何 学 习 算法 

计算 机 科学 家 通过 经 验 来 学 习 : 观察 他 人 如 何 解决 问题 , 然后 亲自 解决 问题 。 接 触 各 种 问题 
解决 技巧 并 学 习 不 同 算法 的 设计 方法 ， 有 助 于 解决 新 的 问题 。 通过 学 习 一 系列 不 同 的 算法 , 可 以 
举一反三 ， 从 而 在 遇 到 类 似 的 问题 时 ， 能 够 快速 加 以 解决 。 
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各 种 算法 之 间 往 往 差 异 巨 大 。 回想 前 文 提 到 的 平方 根 的 例子 , 完全 可 能 有 多 种 方法 来 实现 计 
算 平方 根 的 函数 。 算 法 一 可 能 使 用 了 较 少 的 资源 ,算法 二 返回 结果 所 需 的 时 间 可 能 是 算法 一 的 
10 倍 。 我 们 需要 某 种 方式 来 比较 这 两 种 算法 。 尽 管 这 两 种 算法 都 能 得 到 结果 ， 但 是 其 中 一 种 可 
能 比 男 一 种 “更 好 ”一 一 更 高 效 、 更 快 , 或 者 使 用 的 内 存 更 少 。 随 着 对 算法 的 进一步 学 习 ， 你 会 
掌握 比较 不 同 算法 的 分 析 技巧 。 这 些 技 巧 只 依赖 于 算法 本 身 的 特性 ， 而 不 依赖 于 程序 或 者 实现 算 
法 的 计算 机 的 特性 。 

最 坏 的 情况 是 遇 到 难以 解决 的 问题 ， 即 没有 算法 能 够 在 合理 的 时 间 内 解决 该 问题 。 因 此 , 至 
关 重 要 的 一 点 是 ,要 能 区 分 有 解 的 问题 、 无 解 的 问题 ， 以 及 虽然 有 解 但 是 需要 过 多 的 资源 和 时 间 
来 求解 的 问题 。 

在 选择 算法 时 , 经 常会 有 所 权衡 。 除 了 有 人 解决 问题 的 能 力 之 外 , 计算 机 科学 家 也 需要 知晓 如 
何 评估 一 个 解决 方案 。 总 之 , 问题 通常 有 很 多 解决 方案 , 如 何 找到 一 个 解决 方案 并 且 确 定 其 为 优 
秀 的 方案 ， 是 需要 反复 练习 、 熟 能 生 巧 的 。 
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本 节 将 复习 Python, 并 且 为 前 一 节 提 到 的 思想 提供 更 详细 的 例子 。 如 果 你 刚 开 始 学 习 Python 
或 者 觉得 自己 需要 更 多 的 信息 ， 建 议 你 查看 本 书 结尾 列 出 的 Python 资源 。 本 节 的 目标 是 帮助 你 
复习 Python 并 且 强 化 一 些 会 在 后 续 各 章 中 变 得 非常 重要 的 概念 。 

Python 是 一 门 现代 、 易学、 面向 对 象 的 编程 语言 。 它 拥有 强大 的 内 建 数 据 类 型 以 及 简单 易 用 
的 控制 语句 。 由 于 Python 是 一 门 解释 型 语言 ， 因 此 只 需要 查看 和 描述 交互 式 会 话 就 能 进行 学 习 。 
你 应 该 记得 ,解释 器 会 显示 提示 符 >>>， 然 后 计算 你 提供 的 Python 语句 。 例 如， 以 下 代码 显示 了 
提示 符 、print 函数 、 绪 果 ， 以 及 下 一 个 提示 符 。 


>>> print ("Algorithms and Data Structures") 
>>> Algorithms and Data Structures 
~ 










































































1.4.1 数据 


前 面 提 到 ，Python 支持 面向 对 象 编程 范式 。 这 意味 着 Python 认为 数据 是 问题 解决 过 程 中 的 
关键 点 。 在 Python 以 及 其 他 所 有 面向 对 象 编程 语言 中 ， 类 都 是 对 数据 的 构成 ( 状态 ) 以 及 数据 
能 做 什么 (行为 ) 的 描述 。 由 于 类 的 使 用 者 只 能 看 到 数据 项 的 状态 和 行为 ， 因此 类 与 抽象 数据 类 
型 是 相似 的 。 在 面向 对 象 编程 范式 中 ， 数 据 项 被 称 作对 象 。 一 个 对 象 就 是 类 的 一 个 实例 。 

1. 内 建 原子 数据 类 型 

我 们 首先 复习 原子 数据 类 型 。 Python 有 两 大 内 建 数据 类 实现 了 整数 类 型 和 浮 点 数 类 型 ,相应 
的 Python 类 就 是 int 和 float。 标 准 的 数学 运算 符 ， 即 +、-、* 、/ 以 及 **《〈 震 )， 可 以 和 能 够 
改变 运算 优先 级 的 括号 一 起 使 用 。 其 他 非常 有 用 的 运算 符 包 括 取 余 〈 取 模 ) 运算 符 8， 以 及 整除 
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运算 符 //。 注意 ， 当 两 个 整数 相 除 时 ,其 结果 是 一 个 浮 点 数 ， 而 整除 运算 符 截 去 小 数 部 分 ， 只 返 
回 商 的 整数 部 分 。 


>>> 2+3*4 
14 

>>> (2+3)*4 
20 

> 20 
1024 

>>> 6/3 

2250 

>>> 7/3 
2.3333333333333335 
>>> 7//3 

2 

>>> 7%3 


>>> 3/6 
SS BAK6 
>>> 3%6 


SS 0 
1267650600228229401496703205376 
>>> 


Python 通过 bool 类 实现 对 表达 真 值 非常 有 用 的 布尔 数据 类 型 。 布 尔 对 象 可 能 的 状态 值 是 
True 或 者 False， 布尔 运算 符 有 and、or 以 及 not。 


>>> True 

True 

>>> False 

False 

>>> False or True 

True 

>>> not (False or True) 
False 

>>> True and True 

True 


布尔 对 象 也 被 用 作 相 等 (== )、 大 于 ( > ) 等 比较 运算 符 的 计算 结果 。 此 外 ,结合 使 用 关系 
运算 符 与 逻辑 运算 符 可 以 表达 复杂 的 逻辑 问题 。 表 1-1 展示 了 关系 运算 符 和 逻辑 运算 符 。 


表 1-1 关系 运算 符 和 逻辑 运算 符 








运 算 名 运 算 符 解释 
小 于 * 小 于 运算 符 
xk 2 大 于 运算 符 























小 于 或 等 于 <= 小 于 或 等 于 运算 符 
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( 续 ) 











运 算 名 运 算 符 解释 
大 于 或 等 于 2 大 于 或 等 于 运算 符 

等 于 元 相等 运算 符 

不 等 于 和 不 等 于 运算 符 

逻辑 与 and 两 个 运算 数 都 为 True 时 结果 为 True 

逻辑 或 OF 某 一 个 运算 数 为 rrue 时 结果 为 True 

逻辑 非 not 对 真 值 取 反 ，False 变 为 True，True 变 为 False 























> 

False 

> 0 3D 

True 

LL0) 

True 

标识 符 在 编程 语言 中 被 用 作 名 字 。Python 中 的 标识 符 以 字母 或 者 下 划 线 (_) 开头 ， 区 分 大 
小 写 , 可 以 是 任意 长 度 。 需要 记 住 的 一 点 是 , 采用 能 表达 含义 的 名 字 是 良好 的 编程 习惯 ,这 使 程 
序 代 码 更 易 阅 读 和 理解 。 

当 一 个 名 字 第 一 次 出 现在 赋值 语句 的 左边 部 分 时 ， 会 创建 对 应 的 Python 变量 。 赋 值 语句 将 
名 字 与 值 关联 起 来 。 变 量 存 的 是 指向 数据 的 引用 ， 而 不 是 数据 本 身 。 来 看 看 下 面 的 代码 。 

>>> theSum = 0 

>>> 七 heSum 











































































































>>> theSum = theSum + 1 
>>> 七 heSum 


>>> thesum = True 








>>> 七 heSum 





赋值 语句 thesum = 0 会 创建 变量 thesum， 并 且 令 其 保存 指向 数据 对 象 0 的 引用 (如 图 
1-3 所 示 )。Python 会 先 计算 赋值 运算 符 右 边 的 表达 式 , 然后 将 指向 该 结果 数据 对 象 的 引用 赋 给 左 








边 的 变量 名 。 在 本 例 中 , 由 于 thesum 当前 指向 的 数据 是 整数 类 型 ， 因 此 该 变量 类 型 为 整 型 。 如 
果 数 据 的 类 型 发 生 改 变 ( 如 图 1-4 所 示 )， 正 如 上 面 的 代码 给 thesum 赋值 rrue， 那 么 变量 的 类 
型 也 会 变 成 布尔 类 型 。 赋 值 语句 改变 了 变量 的 引用 ， 这 体现 了 Python 的 动态 特性 。 同 样 的 变量 
可 以 指向 许多 不 同类 型 的 数据 。 


theSum 


BE 有 


图 1-3 ”变量 指向 数据 对 象 的 引 



































二 














theSum 


| 


True 
图 1-4 ”赋值 语句 改变 变量 的 引用 


























2. 内 建 集合 数据 类 型 


除了 数值 类 和 布尔 类 ,Python 还 有 众多 强大 的 内 建 集合 类 。 列 表 、 字 符 串 以 及 元 组 是 概念 上 
非常 相似 的 有 序 集合 ， 但 是 只 有 理解 它们 的 差别 ， 才 能 正确 运用 。 集 ( set ) 和 字典 是 无 序 集合 。 


列表 是 零 个 或 多 个 指向 Python 数据 对 和 象 的 引用 的 有 序 集合 ， 通 过 在 方 括号 内 以 逗号 分 隔 的 
系列 值 来 表达 。 空 列表 就 是 [] 。 列 表 是 异 构 的 ， 这 意味 着 其 指向 的 数据 对 象 不 需要 都 是 同一 个 类 ， 
并 且 这 一 集合 可 以 被 赋值 给 一 个 变量 。 下 面 的 代码 段 展 示 了 列表 含有 多 个 不 同 的 Python 数据 对 象 。 

>>> [1,3,True,6.5] 

[Ly Sr TIUE 6%5.] 

Sy MY DLTSE. Si3)Truey 6G: 

>>> myList 

blis 37 True -6%9] 


注意 ， 当 Python 计算 一 个 列表 时 ， 这 个 列表 自己 会 被 返回 。 然 而 ,为 了 记 住 该 列表 以 便 后 
续 处 理 ， 其 引用 需要 被 赋 给 一 个 变量 。 


由 于 列表 是 有 序 的 ， 因 此 它 支 持 一 系列 可 应 用 于 任意 Python 序列 的 运算 ， 如 表 1-2 所 示 。 


表 1-2 可 应 用 于 任意 Python 序列 的 运算 

















O 
































运 算 名 运 算 符 解释 
索引 [] 取 序 列 中 的 某 个 元 素 
连接 + 将 序列 连接 在 一 起 
重复 重复 N 次 连接 
成 员 in 询问 序列 中 是 否 有 某 元 素 
长 度 len 询问 序列 的 元 素 个 数 
切片 [:] 取出 序列 的 一 部 分 











需要 注意 的 是 ， 列 表 和 序列 的 下 标 从 0 开始 。myList [1:3] 会 返回 一 个 包含 下 标 从 1 到 2 
的 元 素 列表 ( 并 没有 包含 下 标 为 3 的 元 素 )。 


如 果 需 要 快速 初始 化 列表 ， 可 以 通过 重复 运算 来 实现 ， 如 下 所 示 。 


>>> myList =: [0] * 6 
>>> myList 
EQ, Os :Oh Oi HO 0 
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可 以 很 好 地 说 明 这 一 点 。 























非常 重要 的 一 点 是 , 重复 运算 返回 的 结果 是 序列 中 指向 数据 对 象 的 引用 的 重复 。 下 面 的 例子 | 
二 点 


>>> myList = [1,2,3,4] 
>>> A = [myList]*3 
>>> A 


ELL S23 ds EL 2 3 ss, bl 2 3...] 
>>> myList[2] = 45 

>>> A 

EE » 2 MD A [ly 2 5 da Ll 2 45 | 
>>> 


变量 入 包含 3 个 指向 myList 的 引用 。myList 中 的 一 个 元 素 发 生 改 变 ,A 中 的 3 处 都 随即 改变 。 
列表 支持 一 些 用 于 构建 数据 结构 的 方法 ， 如 表 1-3 所 示 。 后 面 的 例子 展示 了 用 法 。 

表 1-3 Python 列表 提供 的 方法 
方 法 名 用 法 解 释 













































































append alist.append (item) 在 列表 未 尾 添 加 一 个 新 元 素 

insert alist.insert (i,item) 在 列表 的 第 i 个 位 置 插入 一 个 元 素 
pop alist .pop() 出 除 并 返回 列表 中 最 后 一 个 元 素 
pop alist.pop (i) 有 除 并 返回 列表 中 第 ;个 位 置 的 元 素 
sort alist.sort() 将 列表 元 素 排序 

reverse alist.reverse!() 将 丈 表 元 素 到 序 排列 

ael Gel alist [] 除 列表 中 第 i 个 位 置 的 元 素 
index alist.index (item) 返回 item 第 一 次 出 现时 的 下 标 
count alist.count (item) 返回 iten 在 列表 中 出 现 的 次 数 
remove alist.remove (item) 从 列表 中 移 除 第 一 次 出 现 的 item 


>>> myLis 
T0243y 
>>> myLis 
>>> myLis 
1024; . 35 
>>> myLis 
>>> myLis 
102442 33 


False 
>>> myLis 
T1024; 3. 








>>> myList 


3 
>>> myLis 
[1024, 4: 
>>> myLis 
TNS 





>>> myList 


全 q 


人 q 














True, 6.5] 
.append (False) 
True, 6.5, Falsel] 


-insert'(2,4.5) 
4.5, True, 6.5, False] 


.Pop () 


4.5, True; 6.5] 
.Dop (1) 


， True, 6.5] 
.Dop (2) 
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>>> myList 
下 024 dy "685 
>>> myList.sort!() 
>>> myList 
dD GD 104] 

>>> myList.reverse!() 
>>> myList 
L026 

>>> myList.count (6.5) 





>>> myList.index(4.5) 
2 
>>> myList.remove(6.5) 
>>> myList 
[1024, 4.5] 
>>> del myList[0] 
>>> myList 
[4.5] 


你 会 发 现 , 像 pop 这 样 的 方法 在 返回 值 的 同时 也 会 修改 列表 的 内 容 ，reverse 等 方法 则 仅 
修改 列表 而 不 返回 任何 值 。 pop 默认 返回 并 删除 列表 的 最 后 一 个 元 素 , 但 是 也 可 以 用 来 返回 并 删 
除 特定 的 元 素 。 这 些 方法 默认 下 标 从 0 开始 。 你 也 会 注意 到 那个 熟悉 的 句点 符号 ， 它 被 用 来 调用 
某 个 对 象 的 方法 。myList .append(False) 可 以 读 作 “请 求 myList 调用 其 append 方法 并 将 
False 这 一 值 传 给 它 ”。 就 连 整数 这 类 简单 的 数据 对 象 都 能 通过 这 种 方式 调用 方法 。 

>>> (54) ._aaq_(21) 


了 5 
>>> 


在 上 面 的 代码 中 ,我们 请 求 整数 对 象 54 执行 其 agg 方法 (该 方法 在 Python 中 被 称 为 
ad9 ), 并且 将 21 作为 要 加 的 值 传 给 它 。 其 结果 是 两 数 之 和 ， 即 75。 我 们 通常 会 将 其 写作 
54+21。 稍 后 会 更 多 地 讨论 这 些 方法 。 

range 是 一 个 常见 的 Python 函数 ， 我 们 常 把 它 与 列表 放 在 一 起 讨论 。range 会 生成 一 个 代 
表 值 序列 的 范围 对 象 。 使 用 1ist 函数 ， 能 够 以 列表 形式 看 到 范围 对 象 的 值 。 下 面 的 代码 展示 了 
这 一 点 


PAYe) 









































>>> range (10) 

range (0, 10) 

>>> list (range(10)) 

EOw T3237 .6% Ti B90] 
>>> range(5,10) 

range(5, 10) 

>>> list (range(5,10)) 

[SF 6 7 8 9 

>>> list (range(5,10,2)) 

ES; 78:9] 

>>> list (range(10,1,-1)) 
[LO 9 “8 Tr Or Drmnd,. Sy 
>>> 
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范围 对 象 表示 整数 序列 。 默 认 情 况 下 ， 它 从 0 开始。 如 果 提 供 更 多 的 参数 ， 它 可 以 在 特定 的 | 
点 开始 和 结束 , 并 且 跳 过 中 间 的 值 。 在 第 一 个 例子 中 , range (10) 从 0 开始 并 且 一 直到 9 为 止 (不 
包含 10 ); 在 第 二 个 例子 中 , range (5,10) 从 5 开始 并 且 到 9 为 止 (不 包含 10 ); range (5,10,2) 

结果 类 似 ， 但 是 元 素 的 间隔 变 成 了 2 ( 10 还 是 没有 包含 在 其 中 )。 


字符 串 是 零 个 或 多 个 字母 、 数 字 和 其 他 符号 的 有 序 集合 。 这 些 字 母 、 数 字 和 其 他 符号 被 称 为 
侈 稍 常量 字符 串 值 通过 引号 〈 单 引号 或 者 双 引 号 均 可 ) 与 标识 符 进行 区 分 。 


>>> "David" 
'David' 
>>> myName = "David" 



































>>> myName[3] 
ri 

>>> myName*2 
'DavidDavid' 
>>> len (myName) 
5 

>>> 


由 于 字符 串 是 序列 ， 因 此 之 前 提 到 的 所 有 序列 运算 符 都 能 用 于 字符 串 。 此 外 , 字符 串 还 有 一 
些 特 有 的 方法 ， 表 1-4 列举 了 其 中 一 些 。 























表 1-4 Python 字符 串 提供 的 方法 
方 法 名 用 法 解 条 



















































































center astring.center (w) 返回 一 个 字符 串 ， 原 字符 串 居 中 ， 使 用 空格 填充 新 字符 串 ， 使 其 长 度 为 w 
count astring.count (item) 返回 item 出 现 的 次 数 

ljust astring.1just (w) 返回 一 个 字符 串 ， 将 原 字 符 串 靠 左 放置 并 填充 空格 至 长 度 w 

rjust astring.rjust (w) 返回 一 个 字符 串 ， 将 原 字 符 串 靠 右 放 置 并 填充 空格 至 长 度 w 

lower astring.1ower () 返回 均 为 小 写字 母 的 字符 串 

upper astring.upper() 返回 均 为 大 写字 母 的 字符 串 

find astring.find (item) 返回 item 第 一 次 出 现时 的 下 标 

split astring.split (schar) 在 schar 位 置 将 字符 串 分 割 成 子 串 





>>> myName 

'David' 

>>> myName .upper () 

'DAVID' 

>>> myName.center (10) 
David l 

>>> myName.find('v') 

>>> myName.split('v') 

[DL | 


split 在 处 理 数据 的 时 候 非 常 有 用 。split 接受 一 个 字符 串 , 并 且 返 回 一 个 由 分 隔 字符 作为 
分 割 点 的 字符 串 列表 。 在 本 例 中 ，v 就 是 分 制 点 。 如 果 没 有 提供 分 隔 字符 ,那么 split 方法 将 
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会 寻找 如 制 表 符 、 换 行 符 和 空格 等 空白 字符 。 








列表 和 字符 串 的 主要 区 别 在 于 ,列表 能 够 被 修改 , 字符 串 则 不 能 。 列表 的 这 一 特性 被 称 为 可 
修改 性 。 列 表 具 有 可 修改 性 ,字符 串 则 不 具有 。 例 如 ,可 以 通过 使 用 下 标 和 赋值 操作 来 修改 列表 











中 的 一 个 元 素 , 但 是 字符 串 不 允许 这 一 改动 。 


>>> myList 

[L835 Truey .G75 
>>> TyListl[0]=2**10 
>>> myList 

FTO24;. -3 5355] 
>>> 
>>> myName 
'David' 
>>> myName[0]='X'"' 





Traceback (most recent call last): 
File "<pyshell#84>", line 1, in -toplevel- 
myName [0]='X' 
TypeError: object doesn't support item assignment 
ne 





由 于 都 是 异 构 数 据 序列 ， 因 此 元 组 与 列表 非常 相似 。 它 们 的 区 别 在 于 ,元 组 和 字符 虽 




















上 伴 
副 


目 
人 碟 





不 可 修改 的 。 元 组 通常 写成 由 括号 包含 并 且 以 逗号 分 隔 的 一 系列 值 。 与 序列 一 样 , 元 组 允许 之 前 


描述 的 任 一 操作 。 


>>> myTuple = (2,True,4.96) 
>>> myTuple 

(2, True, 4.96) 

>>> len (myTuple) 


>>> myTuple[0] 


>>> myTuple * 3 

(2, True, 4.96, 2, True, 4.96, 2, True, 4.96) 
>>> myTuple[0:2] 

(2, True) 





然而 ,如 果 尝 试 改变 元 组 中 的 一 个 元 素 ， 就 会 遇 到 错误 。 请 注意 ,错误 消息 指明 了 问题 的 出 








处 及 原因 。 


>>> myTuplel[1]=False 
Traceback (most recent call last): 
File "<pyshell#137>", line 1, in -toplevel- 
myTuple[l1]=False 
TypeError: object doesn't support item assignment 
p> 
































集 ( set ) 是 由 零 个 或 多 个 不 可 修改 的 Python 数据 对 象 组 成 的 无 序 集合 。 集 不 允许 重复 元 素 ， 
并 且 写 成 由 花 括 号 包含 、 以 逗号 分 隔 的 一 系列 值 。 空 集 由 set () 来 表示 。 集 是 异 构 的 , 并且 可 以 
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通过 下 面 的 方法 赋 给 变量 。 


SA tt Lee} 

{Ealsey db 3 -6%. "Cat. 

人 Ee {4 kr "oat dybs Palse} 
>>> ImYSet 

tolsSey dy 3 Gy 4Eat!} 

pr 


尽管 集 是 无 序 的， 但 它 还 是 支持 之 前 提 到 的 一 些 运 算 ， 如 表 1-5 所 示 。 














表 1-5 Python 集 支持 的 运算 



























































运 算 名 运 算 符 解 释 
成 员 in 询问 集中 是 否 有 某 元 素 
长 度 Ler 获取 集 的 元 素 个 数 
aset | otherset 返回 一 个 包含 aset 与 otherset 所 有 元 素 的 新 集 
让 aset & otherset 返回 一 个 包含 aset 与 otherset 共有 元 素 的 新 集 
aset - otherset 返回 一 个 集 ， 其 中 包含 只 出 现在 aset 中 的 元 素 
<= aset <= otherset 询问 aset 中 的 所 有 元 素 是 否 都 在 otherset 中 








>>> mySet 

{RaLlSes. 4 By "6 Teat 
>>> len (mySet) 

与 

>>> False in mySet 

True 

>>> "dog" in mySet 

False 

四 


集 支 持 一 系列 方法 ,如 表 1-6 所 示 。 在 数学 过 集合 概念 的 人 应 该 对 它们 非常 熟悉 。 注 


意 ，union、intersection、issubset 和 difference 都 有 可 用 的 运算 符 。 


表 1-6 ”Python 集 提供 的 方法 




































































方法 名 用 法 解 妓 

union aset .union(otherset) 返回 一 个 包含 aset 和 otherset 所 有 元 素 的 集 
intersection aset.intersection(otherset) 返回 一 个 仅 包含 两 个 集 共 有 元 素 的 集 
difference aset .difference (otherset) 返回 一 个 集 ， 其 中 仅 包 含 只 出 现在 aset 中 的 元 素 
issubset aset .issubset (otherset) 询问 aset 是 否 为 otherset 的 子 集 

agdd aset .add (item) 向 aset 添加 一 个 元 素 

remove aset .remove (item) 将 item 从 aset 中 移 除 

pop aset .pop() 随机 移 除 aset 中 的 一 个 元 素 


clear aset .clear() 清除 aset 中 的 所 有 元 素 
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>>> mySet 
{False, 4.5;, 3, 6; "cat 
>>> yourSet = {99,3,100} 
>>> mySet .union(yourSet) 


{Palsey, 425 3 ‘L100 6% "Gat .99 
>>> mySet | yourSet 

{FaLlLse; 4.5, 3, L100; 6 "cat™; 99 
>>> mySet.intersection(yourSet) 
{3 


>>> mySet & yourSet 
{3 
>>> mySet .difference(yourSet) 
{False, 4.5, 6, 'cat'} 

>>> mySet - yourSet 

{False, 4.5, 6, 'cat'} 

>>> {3,100}.issubset (yourSet) 





True 

>>> {3,100}<=yourSet 

True 

>>> mySet .add ("house") 

>>> mySet 

{False, 4.5, 3, 6, 'house', 'cat'} 
>>> mySet .remove (4.5) 

>>> mySet 

{False, 3, 6, 'house', 'cat'} 
>>> mySet .pop() 

False 

>>> mySet 

{3, 6, 'house', 'cat'} 

>>> mySet.clear() 

>>> mySet 





set() 
>>> 


最 后 要 介绍 的 Python 集合 是 字典 。 字 典 是 无 序 结 构 ， 由 相关 的 元 素 对 构成 ， 其 中 每 对 元 素 
都 由 一 个 键 和 一 个 值 组 成 。 这 种 键 - 值 对 通常 写成 键 : 值 的 形式 。 字 典 由 花 括 号 包含 的 一 系列 以 去 
号 分 隔 的 键 - 值 对 表达 ， 如 下 所 示 。 


ly 


























>>> capitals = {'Iowa':'DesMoines', 'Wisconsin':'Madison'} 
>>> capitals 

{'Wisconsin':'Madison', 'Iowa':'DesMoines'} 

bd 








可 以 通过 键 访问 其 对 应 的 值 ， 也 可 以 向 字典 添加 新 的 键 - 值 对 。 访 问 字 典 的 语法 与 访问 序列 
的 语法 十 分 相似 ， 只 不 过 是 使 用 键 来 访问 ， 而 不 是 下 标 。 添 加 新 值 也 类 似 。 


>>> capitals['Iowa'] 

















'DesMoines' 

>>> capitals['Utah']='SaltLakeCity' 

>>> capitals 

{'Utah':'SaltLakeCity', 'Wisconsin':'Madison', 'Iowa':'DesMoines'} 
>>> capitals['California']='Sacramento' 


>>> capitals 
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{'Utah':'SaltLakeCity', 'Wisconsin':'Madison', 'Iowa':'DesMoines', 
'California':'Sacramento'} 

>>> len(capitals) 

4 

> 这 之 


需要 说 记 , 字典 并 不 是 根据 键 来 进行 有 序 维护 的 。 第 一 个 添加 的 键 - 值 对 ( 'Utah' :'Salt- 
Lakecity' ) 被 放 在 了 字典 的 第 一 位 , 第 二 个 添加 的 键 - 值 对 ('california':'Sactramento' ) 
则 被 放 在 了 最 后 。 键 的 位 置 是 由 散 列 来 决定 的 ， 第 5 章 会 详细 介绍 散 列 。 以 上 示例 也 说 明 ，1len 
函数 对 字典 的 功能 与 对 其 他 集合 的 功能 相同 。 

字典 既 有 运算 符 ， 又 有 方法 。 表 1-7 和 表 1-8 分 别 展示 了 它们 。keys 、values 和 items 方 
法 均 会 返回 包含 相应 值 的 对 象 。 可 以 使 用 1ist 函数 将 字典 转换 成 列表 。 在 表 1-8 中 可 以 看 到 ， 
get 方法 有 两 种 版 本 。 如 果 键 没有 出 现在 字典 中 ，get 会 返回 None。 然 而 ， 第 二 个 可 选 参数 可 
以 返回 特定 值 。 





















































表 1-7 Python 字典 支持 的 运算 











































































































运 算 名 运 算 符 解 释 
myDict [x 返回 与 x 相关 联 的 什 ， 如 果 没有 则 报错 
in key in adict 如 果 key 在 字典 中 ， 返 回 True， 否 则 返回 False 
del del adict[key] 从 字典 中 删除 key 的 键 - 值 对 
表 1-8 Python 字典 提供 的 方法 
方 法 名 用 法 解 释 
keys adqict .keys () 返回 包含 字典 中 所 有 键 的 dict_keys 对 象 
Values adict.values () 返回 包含 字典 中 所 有 值 的 aict_values 对 象 
items adict.items() 返回 包含 字典 中 所 有 键 - 值 对 的 dict_items 对 象 
get aaict .ge (k) 返回 x 对 应 的 值 ， 如 果 没 有 则 返回 None 
get adict.get (k, alt) 返回 K 对 应 的 值 ， 如 果 没 有 则 返回 alt 
>>> phoneext={'david':1410, 'brad':1137} 
>>> phoneext 
{'brad':1137, 'david':1410} 
>>> phoneext .keys () 
dict_keys(['brad', 'david']) 
>>> list (phoneext .keys()) 
['brad', 'david'] 
>>> phoneext .values () 
dict_values([1137, 1410]) 
>>> list (phoneext .values()) 
EEL37; 二]0.] 
>>> phoneext .items () 
dict_items([('brad', 1137), ('david', 1410)]) 


>>> list (phoneext.items()) 
[('brad', 1137), ('david', 1410)] 
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>>> phoneext .get ("kent") 

>>> phoneext .get ("kent", "NO ENTRY") 
"NO ENTRY 

> 


1.4.2 ”输入 与 输出 


程序 经 常 需要 与 用 户 进行 交互 ， 以 获得 数据 或 者 提供 菜 种 结果 。 目 前 的 大 多 数 程序 使 用 对 话 
框 作为 要 求 用 户 提供 某 种 输入 的 方式 。 尽 管 Python 确实 有 方法 来 创建 这 样 的 对 话 框 ， 但 是 可 以 
利用 更 简单 的 函数 。Python 提供 了 一 个 函数 , 它 使 得 我 们 可 以 要 求 用 户 输入 数据 并 且 返 回 一 个 字 
符 串 的 引用 。 这 个 函数 就 是 input。 

input 了 因 数 接受 一 个 字符 串 作为 参数 。 由 于 该 字符 串 包 含有 用 的 文本 来 提示 用 户 输入 , 因此 
它 经 常 被 称 为 提示 字符 串 。 举 例 来 说 ， 可 以 像 下 面 这 样 调 用 input。 

aName = input('Please enter your name: ') 

不 论 用 户 在 提示 字符 串 后 面 输入 什么 内 容 , 都 会 被 存储 在 aName 变量 中 。 使 用 input 函数 ， 
可 以 非常 简便 地 写 出 程序 ， 让 用 户 输入 数据 ， 然 后 再 对 这 些 数据 进行 进一步 处 理 。 例 如 , 在 下 面 
的 两 条 语句 中 , 第 一 条 要 求 用 户 输入 姓名 , 第 二 条 则 打印 出 对 输入 字符 串 进行 一 些 简单 处 理 后 的 


胃 
结果 0 


















































aName = input ("Please enter your name ") 
print ("Your name in all capitals is ",aName.upper(), 
"and has length", lenl(aName)) 


需要 注意 的 是 , input 函数 返回 的 值 是 一 个 字符 串 , 它 包 含 用 户 在 提示 字符 串 后 面 输 入 的 所 
有 字符 。 如 果 需 要 将 这 个 字符 串 转 换 成 其 他 类 型 ， 必 须 明确 地 提供 类 型 转换 。 在 下 面 的 语句 中 ， 
用 户 输入 的 字符 串 被 转换 成 了 浮 点 数 ， 以 便于 后 续 的 算术 处 理 。 


sradius = input ("Please enter the radius of the circle ") 
radius = float (sradius) 
diameter = 2 * radius 


格式 化 字符 串 
print 函数 为 输出 Python 程序 的 值 提供 了 -一 种 非常 简便 的 方法 。 它 接受 零 个 或 者 多 个 参数 ， 
并 且 将 单个 空格 作为 默认 分 隔 符 来 显示 结果 。 通 过 设置 sep 这 一 实际 参数 可 以 改变 分 隔 符 。 此 
外 ， 每 一 次 打印 都 默认 以 换行 符 结尾 。 这 一 行为 可 以 通过 设置 实际 参数 end 来 更 改 。 下 面 是 一 
些 例子 。 


>>> print ("Hello") 
Hello 
>>> print ("Hello", "World") 

Hello World 

SS Drint ("Hello TWOoOrla, “SeDS Kw 
Hello***World 

>>> print ("Hello", "World", end="***") 
Hello World***>>> 
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更 多 地 控制 程序 的 输出 格式 经 常 十 分 有 用 。 幸 和 运 的 是 , Python 提供 了 另 一 种 叫 作 格式 化 字符 
串 的 方式 。 格 式 化 字符 串 是 一 个 模板 ， 其 中 包含 保持 不 变 的 单词 或 空格 ， 以 及 之 后 插入 的 变量 的 
占 位 符 。 例 如 ， 下 面 的 语句 包含 is 和 years ol1d. ， 但 是 名 字 和 年 龄 会 根据 运行 时 变量 的 值 而 
发 生 改 变 。 


print (aName, "is", age, "years old.") 


使 用 格式 化 字符 串 ， 可 以 将 上 面 的 语句 重 写成 下 面 的 语句 。 


Pint("g%Ss is %d years old." $ (aName, age)) 


这 个 简单 的 例子 展示 了 一 个 新 的 字符 串 表 达 式 。%8 是 字符 串 运 算 符 ， 被 称 作 格 式 化 运算 符 。 
表达 式 的 左边 部 分 是 模板 ( 也 叫 格式 化 字符 串 )， 右 边 部 分 则 是 一 系列 用 于 格式 化 字符 串 的 值 。 
需要 注意 的 是 ， 右 边 的 值 的 个 数 与 格式 化 字符 串 中 gs 的 个 数 一 致 。 这 些 值 将 依次 从 左 到 右 地 被 换 
入 格式 化 字符 串 。 

让 我 们 更 进一步 地 观察 这 个 格式 化 表达 式 的 左右 两 部 分 。 格 式 化 字符 串 可 以 包含 一 个 或 者 多 
个 转换 声明 。 转 换 字符 告诉 格式 化 运算 符 , 什么 类 型 的 值 会 被 插 人 到 字符 串 中 的 相应 位 置 。 在 上 
面 的 例子 中 ，ss 声明 了 一 个 字符 串 ，sq 则 声明 了 一 个 整数 。 其 他 可 能 的 类 型 声明 还 包括 i 、u、 
f、e、g、c 和 %。 表 1-9 总 结 了 所 有 的 类 型 声明 。 


表 1-9 格式 化 字符 串 可 用 的 类 型 声明 

















































































































字 符 输出 格式 
d、 i 整数 
u 无 符号 整数 
f m.dddd 格式 的 浮 点 数 
e m.dddde+/-xx 格式 的 浮 点 数 
E m.ddddE+/-xx 格式 的 浮 点 数 
9 对 指数 小 于 -4 或 者 大 于 5 的 使 用 se， 和 否则 使 用 sf 
c 单个 字符 
s 字符 串 ， 或 者 任意 可 以 通过 str 函数 转换 成 字符 串 的 Python 数据 对 象 
多 插入 一 个 常量 符号 


可 以 在 s 和 格式 化 字符 之 间 加 入 一 个 格式 化 修改 符 。 格 式 化 修改 符 可 以 根据 给 定 的 宽度 对 值 
进行 左 对 齐 或 者 右 对 齐 ， 也 可 以 通过 小 数 点 之 后 的 一 些 数字 来 指定 宽度 。 表 1-10 解释 了 这 些 格 
式 化 修改 符 。 





表 1-10 格式 化 修改 符 


















































修 改 符 例 子 解释 

数字 820G 将 值 放 在 20 个 字符 宽 的 区 域 中 

sa-20q 将 值 放 在 20 个 字符 宽 的 区 域 中 ， 并 且 左 对 章 

+ a+20q 将 值 放 在 20 个 字符 宽 的 区 域 中 ， 并 且 右 对 章 

0 8020q 将 值 放 在 20 个 字符 宽 的 区 域 中 ， 并 在 前 面 补 上 0 
820.2 将 值 放 在 20 个 字符 宽 的 区 域 中 ， 并 且 保留 小 数 点 后 2 位 

(name) s(name)a 从 字典 中 获取 name 键 对 应 的 值 

















格式 化 运算 符 的 右边 是 将 被 插入 格式 化 字符 串 的 一 些 值 。 这 个 集合 可 以 是 元 组 或 者 字典 。 如 
果 这 个 集合 是 元 组 , 那么 值 就 根据 位 置 次 序 被 插入 。 也 就 是 说 , 元 组 中 的 第 一 个 元 素 对 应 于 格式 
化 字符 串 中 的 第 一 个 格式 化 字符 。 如 果 这 个 集合 是 字典 ,那么 值 就 根据 它们 对 应 的 键 被 插入 ,并 
且 所 有 的 格式 化 字符 必须 使 用 (name ) 修改 符 来 指定 键 名 。 























>>> price = 24 

>>> item = "banana" 

>>> print ("The %s costs %d cents" % (item,price)) 

The banana costs 24 cents 

>>> print ("The %+10s costs %5.2f cents" % (item,price)) 
The banana costs 24.00 cents 

>>> print ("The %+10s costs %10.2f cents" % (item,price)) 
The banana costs 24.00 cents 

>>> itemdict = {"item":"banana","cost":24} 

>>> print ("The %(item)s costs %$(cost)7.1f cents" % itemdict) 
The banana costs 24.0 cents 

> 


除了 格式 化 字符 串 可 以 使 用 格式 化 字符 和 修改 符 之 外 ，Python 的 字符 串 还 包含 了 一 个 
format 方法 。 该 方法 可 以 与 新 的 Formatter 类 结合 起 来 使 用 ， 从 而 实现 复杂 字符 串 的 格式 化 。 
可 以 在 Python 参考 手册 中 找到 更 多 关于 这 些 特性 的 内 容 。 


1.4.3 ”控制 结构 


正如 前 文 所 述 , 算法 需要 两 个 重要 的 控制 结构 : 迭代 和 分 支 。 Python 通过 多 种 方式 支持 这 两 
种 控制 结构 。 程 序 员 可 以 根据 需要 选择 最 有 效 的 结构 。 

对 于 迭代 ，Python 提供 了 标准 的 while 语句 以 及 非常 强大 的 for 语句 。while 语句 会 在 给 
定 条 件 为 真 时 重复 执行 一 段 代码 ， 如 下 所 示 。 


> COUNEere EL 

>>> while counter <= 5: 
print ("Hello, world") 
Counter = counter + 1 




















Hello, world 
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Hello, world 
Hello, world 
Hello, world 
Hello, world 


这 上 段 代码 将 “Hello, world” 打 印 了 5 遍 。Python 会 在 每 次 重复 执行 前 计算 while 语句 中 的 
条 件 表达 式 。 由 于 Python 本 身 要 求 强制 缩 进 ， 因 此 可 以 非常 容易 地 看 清楚 while 语句 的 结构 。 

while 语句 是 非常 普遍 的 迭代 结构 ， 我 们 在 很 多 不 同 的 算法 中 都 会 用 到 它 。 在 很 多 情况 下 ， 
迭代 过 程 由 复合 条 件 来 控制 。 

while counter <= 10 and not done: 

在 这 个 例子 中 ， 和 迭代 语句 只 有 在 上 面 两 个 条 件 都 满足 的 情况 下 才 会 被 执行 。 变 量 counter 
的 值 需要 小 于 或 等 于 10, 并 日 变量 aone 的 值 需 要 为 False(not False 就 是 True ), 因此 True 
and True 的 最 后 结果 才 是 True。 

while 语句 在 众多 情况 下 都 非常 有 用 ， 男 一 个 迭代 结构 for 语句 则 可 以 很 好 地 和 Python 的 
各 种 集合 结合 在 一 起 使 用 。for 语句 可 以 用 于 遍历 一 个 序列 集合 的 每 个 成 员 ， 如 下 所 示 。 


S33 fOr Ltem. Tn. [E3627.5]3 
print (item) 






































mw 


for 语句 将 列表 [1,3,6,2,5] 中 的 每 一 个 值 依次 赋 给 变量 item。 然 后 ， 迭 代 语 名 就 会 被 执 
行 。 这 种 做 法 对 任意 的 序列 集合 ( 列表 、 元 组 以 及 字符 串 ) 都 有 效 。 

for 语句 的 一 个 常见 用 法 是 在 一 定 的 值 范围 内 进行 有 限 次 数 的 迭代 。 下 面 的 语句 会 执行 
print 函数 5 次 。range 函数 会 返回 一 个 包含 序列 0、1、2、3、4 的 范围 对 象 ， 然 后 每 个 值 都 
会 被 赋 给 变量 item。 接 着 ，Python 会 计算 该 值 的 平方 并 且 打 印 结 果 。 


>>> for item in range(5): 
print (item**2) 

















for 语句 的 另 一 个 非常 有 用 的 使 用 场景 是 处 理 字 符 串 中 的 每 一 个 字符 。 下 面 的 代码 段 遍 历 一 
个 字符 串 列 表 , 并 且 将 每 一 个 字符 串 中 的 每 一 个 字符 都 添加 到 结果 列表 中 。 最 终 的 结果 就 是 一 个 
包含 所 有 字符 串 的 所 有 字符 的 列表 。 
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> WOrdL1iSt = [uedat", Fdog mn, Eabdiy 
>>> letterlist = [] 
>>> for aword in wordlist: 
for aletter in aword: 
letterlist.append(aletter) 


Ss letterlist 

Fe Ds Se 人 Re 让 A i ro, De i | 

分 支 语句 允许 程序 员 进 行 询问 ,然后 根据 结果 , 采取 不 同 的 行动 。 绝 大 多 数 的 编程 语言 都 提 
供 两 种 有 用 的 分 支 结构 : ifelse 和 if。 以 下 是 使 用 ifelse 语句 的 一 个 简单 的 二 元 分 支 示例 。 


TE 0 

print ("Sorry, value is negative") 
else: 

print (math. sqrt (n)) 


在 这 个 例子 中 ， Python 会 检查 n 所 指向 的 对 象 是 否 小 于 0。 如 果 是 ， 就 会 打印 一 条 消息 ,说 
明 它 是 负 值 ; 如 果 不 是 ， 就 会 执行 else 分 支 来 计算 它 的 平方 根 。 

和 其 他 所 有 控制 结构 一 样 , 分 支 结 构 文 持 嵌 套 , 一 个 问题 的 结果 能 帮助 决定 是 否 需要 继续 问 
下 一 个 问题 。 例 如 ， 假 设 score 是 指向 计算 机 科学 考试 分 数 的 变量 。 


iTf SCOPe. Ss 903 













































































print ('A') 
else: 
if. SOCOre' 80:: 
print('B') 
else 
if score >= 70: 
Drint Cy 
else: 
if Soore>e .60 
信人 LD 
else: 
print ("EF") 


这 一 代码 段 通过 打印 字母 等 级 来 对 变量 score 进行 分 类 。 如 果 分 数 大 于 或 等 于 90， 这 一 语 
名 会 打印 A; 如 果 小 于 90 (else )， 会 接着 问 下 一 个 问题 。 如 果 分 数 大 于 或 等 于 80， 因 为 小 于 
90， 所 以 它 一 定 介 于 80 和 89 之 间 ， 那 么 语句 就 会 打印 B。 可 以 发 现 ，Python 的 缩 进 模式 帮助 我 
们 在 不 需要 额外 语法 元 素 的 情况 下 有 效 地 关联 对 应 的 if 和 else。 

另 一 种 表达 风 套 分 支 的 语法 是 使 用 elif 关键 字 。 将 else 和 下 一 个 if 结合 起 来 ， 可 以 减 
少 额外 的 向 套 层次 。 注 意 ,最 后 的 el se 仍然 是 必需 的 ， 它 用 来 在 所 有 分 支 条 件 都 不 满足 的 情况 
下 提供 默认 分 支 。 


if Score >= 90: 
print ('A') 
elif score >= 80: 
Drint ("By ) 
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elif score >= 70: 





RLNEETED) 
elif score >= 60: 
DRINt (DD.) 

else: 
这 着 世相) 


Python 也 有 单 路 分 支 结 构 ， 即 if 语句 。 如 果 条 件 为 真 ， 就 会 执行 相应 的 代码 。 如 果 条 件 为 
假 ， 程 序 会 跳 过 if 语句 ， 执 行 下 面 的 语句 。 例 如 ， 下 面 的 代码 段 会 首先 检查 变量 n 的 值 是 否 为 
负 。 如 果 值 为 负 ， 那 么 就 取 它 的 绝对 值 ， 再 计算 它 的 平方 根 。 


二 下 
n = abs(n) 
print (math.sart (n)) 


列表 可 以 通过 使 用 迭代 结构 和 分 支 结构 来 创建 。 这 种 方式 被 称 为 列表 解析 式 。 通 过 列表 解析 
式 ， 可 以 根据 一 些 处 理 和 分 支 标准 轻松 创建 列表 。 举 例 来 说 ， 如 果 想 创建 一 个 包含 前 10 个 完全 
平方 数 的 列表 ， 可 以 使 用 以 下 的 for 语句 。 
SLLSt Ss: 
>>> for x in range(1,11): 
sqlist.append (x*x) 


> LTS 
EI: i 9 6 36s 9 6 BL OO 

















使 用 列表 解析 式 ， 只 需 一 行 代码 即 可 创建 完成 。 
>>> Sqlist = [Xx*x for x in range(1,11)] 


SS SALlLSt 

[lyr dy 9 Loy 25 B36 49y 64y, Bly OO 

变量 x 会 依次 取 由 for 语句 指定 的 1 到 10 为 值 。 之 后 , 计算 x*x 的 值 并 将 结果 添加 到 正在 
构建 的 列表 中 。 列 表 解 析 式 也 允许 添加 一 个 分 支 语句 来 控制 添加 到 列表 中 的 元 素 ， 如 下 所 示 。 


SS SOLLSt Ee. [X* £0 RIN Eangett, 1 TES e700 
>>> sqlist 

LL Qn D5 m9 B11 

>>> 


这 一 列表 解析 式 构 建 的 列表 只 包含 1 到 10 中 奇数 的 平方 数 。 任 意 支 持 迭 代 的 序列 都 可 用 于 
列表 解析 式 。 


>>>[ch.upper() for ch in 'comprehension' if ch not in 'aeiou'] 
| PM vp LR > Ns 过 机 | 
>>> 


1.4.4 ”异常 处 理 
在 编写 程序 时 通常 会 遇 到 两 种 错误 。 第 一 种 是 语法 错误 ,也 就 是 说 , 程序 员 在 编写 语句 或 者 
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表达 式 时 出 错 。 例 如 ， 在 写 for 语句 时 忘记 加 冒号 。 


>>> for i in range(10) 
SyntaxError: invalid syntax (<pyshell#61>, line 1) 


在 这 个 例子 中 ，Python 解释 器 发 现 ， 由 于 语句 不 符合 Python 语法 规范 ， 因 此 它 无 法 执行 这 
条 指令 。 初 学 者 经 常会 犯 语法 错误 。 

第 二 种 是 逻辑 错误 ， 即 程序 能 执行 完成 但 返回 了 错误 的 结果 。 这 可 能 是 由 于 算法 本 身 有 错 ， 
或 者 程序 员 没 有 正确 地 实现 算法 。 有 了 时， 逻辑 错误 会 导致 诸如 除 以 0、 越 界 访问 列表 等 非常 严重 
的 情况 。 这 些 逻 辑 错 误会 导致 运行 时 错误 ,进而 导致 程序 终止 运行 。 通常 ， 这 些 运 行 时 错误 被 称 
为 异常 。 

许多 初级 程序 员 简 单 地 把 异常 等 同 于 引起 程序 终止 的 严重 运行 时 错误 。 然而 , 大 多 数 编 程 语 
言 都 提供 了 让 程序 员 能 够 处 理 这 些 错误 的 方法 。 此 外 , 程序 员 也 可 以 在 检测 到 程序 执行 有 问题 的 
情况 下 自己 创建 异常 。 

当 异 常 发 生 时 ， 我 们 称 程序 “ 抛 出 ”异常 。 可 以 用 try 语句 来 “处 理 ” 被 抛 出 的 异常 。 例 
如 ， 以 下 代码 段 要 求 用 户 输入 一 个 整数 ,然后 从 数学 库 中 调用 平方 根 函 数 。 如 果 用 户 输入 了 一 个 
大 于 或 等 于 0 的 值 ,那么 其 平方 根 就 会 被 打印 出 来 。 但 是 ， 如 果 用 户 输入 了 一 个 负数 ,平方 根 函 
数 就 会 报告 ValueError 异常 。 


>>> anumber = int (input ("Please enter an integer ")) 
Please enter an integer -23 
>>> print (math.sart (anumber)) 
Traceback (most recent call last): 
File "<pyshell#102>", line 1, in <module> 

print (math.sqrt (anumber)) 
ValueError: math domain error 
me 


可 以 在 try 语句 块 中 调用 print 函数 来 处 理 这 个 异常 。 对 应 的 except 语句 块 “捕捉 ”到 
这 个 异常 ， 并 且 为 用 户 打 印 一 条 提示 消息 。 


mr Ey 
print (math.sqrt (anumber)) 
except: 
print ("Bad Value for square root") 
print ("Using absolute value instead") 
print (math.sqrt (abs (anumber) ) ) 































































































Bad Value for Square root 
Using absolute value instead 
4 .95083152331 

> 


except 会 捕捉 到 sart 抛 出 的 异常 并 打印 提示 消息 ， 然 后 会 使 用 对 应 数字 的 绝对 值 来 保证 
sgrt 的 参数 非 负 。 这 意味 着 程序 并 不 会 终止 ， 而 是 继续 执行 后 续 语 句 。 
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程序 员 也 可 以 使 用 raise 语句 来 触发 运行 时 异常 。 例 如 ， 可 以 先 检查 值 是 否 为 负 ， 并 在 值 
为 负 时 抛 出 异常 ， 而 不 是 给 sqart 函数 提供 负数 。 下 面 的 代码 段 显 示 了 创建 新 的 RuntimeError 
异常 的 结果 。 注 意 ， 程 序 仍然 会 终止 ,但 是 导致 其 终止 的 异常 是 由 我 们 自己 手动 创建 的 。 


>>> if anumber < 0: 
raise RuntimeError("You can't use a negative number") 
. else: 
print (math.sqrt (anumber)) 









































Traceback (most recent call last): 

File "<stdin>", line 2, in <module> 
RuntimeError: You can't use a negative number 
六 区 


除了 RuntimeError 以 外 ,还 可 以 抛 出 很 多 不 同类 型 的 异常 。 请 查看 Python 参考 手册 ， 了 
解 完整 的 异常 类 型 以 及 如 何 自己 创建 异常 。 


1.4.5 定义 函数 

之 前 的 过 程 抽象 例子 调用 了 Python 数学 模块 中 的 sqrt 函数 来 计算 平方 根 。 通 常 来 说 , 可 以 
通过 定义 函数 来 隐藏 任何 计算 的 细节 。 函 数 的 定义 需要 一 个 函数 名 一 系列 参数 以 及 一 个 函数 体 。 
函数 也 可 以 显 式 地 返回 一 个 值 。 例 如 ， 下 面 定义 的 简单 函数 会 返回 传人 值 的 平方 。 


>>> def sdquare (n): 
et ur 2 














Se square (3) 

9 

>>> square (square(3)) 

81 

这 个 函数 定义 包含 函数 名 square 以 及 一 个 括号 包含 的 形式 参数 列表 。 在 这 个 函数 中 , n 是 
唯一 的 形式 参数 ， 这 意味 着 square 只 需要 一 份 数据 就 能 完成 任务 。 计 算 n**2 并 返回 结果 的 细 
节 被 隐藏 起 来 。 如 果 要 调用 square 函数 , 可 以 为 其 提供 一 个 实际 参数 值 (在 本 例 中 是 3 ), 并 
要 求 Python 环境 计算 。 注 意 ，square 函数 的 返回 值 可 以 作为 参数 传递 给 另 一 个 函数 调用 。 
通过 运用 著名 的 牛顿 迭代 法 , 可 以 自己 实现 平方 根 函 数 。 用 于 近似 求解 平方 根 的 牛顿 迭代 法 
使 用 适 代 计算 的 方法 来 求解 正确 的 结果 。 























1 
neweuess =—x(oldeuess+ 
2 oldguess 





以 上 公式 接受 一 个 值 n, 并 且 通 过 在 每 一 次 迭代 中 将 neweuess 赋值 给 o1dguess 来 反复 猜测 平 
方 根 。 初 次 猜测 的 平方 根 是 zw2。 代 码 清单 1-1 展示 了 该 函数 的 定义 ， 它 接受 值 n 并且 返回 20 轮 
迭代 之 后 的 n 的 平方 根 。 牛顿 迭代 法 的 细节 都 被 隐藏 在 函数 定义 之 中 ,用 户 不 需要 知道 任何 实现 
细节 就 可 以 调用 该 函数 来 求解 平方 根 。 代 码 清单 1-1 同时 也 展示 了 # 的 用 法 。 任 何 跟 在 # 之 后 一 行 
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内 的 字符 都 是 注释 。Python 解释 器 不 会 执行 这 些 注释 。 


代码 清单 1-1 通过 牛顿 迭代 法 求解 平方 根 








1 def squareroot (n): 

2 root = n/2 #initial guess will be 1/2 of n 
3 for k in range(20): 

4 NOGt. SS (1/2)*(E00t:F (nL TOGE)) 

3 

6 


return root 





>>> squareroot (9) 
3%0 

>>> squareroot (4563) 
67.549981495186216 
办 


1.4.6 ”Python 面向 对 象 编程 : 定义 类 


前 文 说 过 ,Python 是 一 门面 向 对 象 的 编程 语言 。 到 目前 为 止 , 我 们 已 经 使 用 了 一 些 内 建 的 类 
来 展示 数据 和 控制 结构 的 例子 。 面 向 对 象 编程 语言 最 强大 的 一 项 特性 是 允许 程序 员 ( 问题 求解 者 ) 
创建 全 新 的 类 来 对 求解 问题 所 需 的 数据 进行 建 模 。 

我 们 之 前 使 用 了 抽象 数据 类 型 来 对 数据 对 象 的 状态 及 行为 进行 逻辑 描述 。 通过 构建 能 实现 抽 
象 数据 类 型 的 类 ,可 以 利用 抽象 过 程 ， 同 时 为 真正 在 程序 中 运用 抽象 提供 必要 的 细节 。 每 当 需 要 
实现 抽象 数据 类 型 时 ， 就 可 以 创建 新 类 。 

1. Fraction 类 

要 展示 如 何 实现 用 户 定义 的 类 ， 一 个 常用 的 例子 是 构建 实现 抽象 数据 类 型 Fraction 的 类 。 
我 们 已 经 看 到 ，Python 提供 了 很 多 数值 类 。 但 是 在 有 些 时 候 ， 需 要 创建 “看 上 去 很 像 ” 分 数 的 数 
据 对 象 。 





















































































































































像 这 样 的 分 数 两 部 分 组 成 。 上 面 的 值 称 作 分 子 ， 可 以 是 任意 整数 。 下 面 的 值 称 作 分 母 ， 
可 以 是 任意 大 于 0 的 整数 ( 负 的 分 数 带 有 人 负 的 分 子 )。 尽 管 可 以 用 浮 点 数 来 近似 表示 分 数 ， 但 我 
们 在 此 希望 能 精确 表示 分 数 的 值 。 

Fraction 对 象 的 表现 应 与 其 他 数值 类 型 一 样 。 我 们 可 以 针对 分 数 进行 加 、 减 、 乘 、 除 等 运 
算 ， 也 能 够 使 用 标准 的 斜 线形 式 来 显示 分 数 ， 比 如 3/5。 此 外 ， 所 有 的 分 数 方法 都 应 该 返回 结果 
的 最 简 形 式 。 这 样 一 来 ， 不 论 进行 何 种 运算 ， 最 后 的 结果 都 是 最 简 分 数 。 

在 Python 中 定义 新 类 的 做 法 是 , 提供 一 个 类 名 以 及 一 整套 与 函数 定义 语法 类 似 的 方法 定义 。 
以 下 是 一 个 方法 定义 框架 。 
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class Fraction: | 
# 方法 定义 


所 有 类 都 应 该 首先 提供 构造 方法 。 构 造 方法 定义 了 数据 对 象 的 创建 方式 。 要 创建 一 个 
Fraction 对 象 , 需要 提供 分 子 和 分 母 两 部 分 数据 。 在 Python 中, 构造 方法 总 是 命名 为 init 
( 即 在 init 的 前 后 分 别 有 两 个 下 划 线 )， 如 代码 清单 1-2 所 示 。 


代码 清单 1-2 Fraction 类 及 其 构造 方法 





























1 class Fraction: 

2 

3 def _ init _(self, top, bottom): 
4 

5 self.num = top 

6 self.den = bottom 


























注意 ， 形 式 参数 列表 包含 3 项 。self 是 一 个 总 是 指向 对 象 本 身 的 特殊 参数 ， 它 必须 是 第 一 
个 形式 参数 。 然 而 , 在 调用 方法 时 ， 从 来 不 需要 提供 相应 的 实际 参数 。 如 前 所 述 ， 分 数 需要 分 子 
与 分 母 两 部 分 状态 数据 。 构 造 方法 中 的 self .num 定义 了 Fraction 对 象 有 一 个 叫 作 num 的 内 
部 数据 对 象 作 为 其 状态 的 一 部 分 。 同 理 ，self .den 定义 了 分 母 。 这 两 个 实际 参数 的 值 在 初始 时 
赋 给 了 状态 ， 使 得 新 创建 的 Fraction 对 象 能 够 知道 其 初始 值 。 

要 创建 Fraction 类 的 实例 , 必须 调用 构造 方法 。 使 用 类 名 并 且 传 人 状态 的 实际 值 就 能 完成 
调用 (注意 ， 不 要 直接 调用 _init__)。 


myfraction = Fraction(3,5) 














以 上 代码 创建 了 一 个 对 象 ， 名 为 myfraction,， 值 为 3/5。 图 1-5 展示 了 这 个 对 象 。 





myfraction 


图 1-5 Fraction 类 的 一 个 实例 





接 下 来 实现 这 一 抽象 数据 类 型 所 需要 的 行为 。 考虑 一 下 ,如果 试 图 打印 Fraction 对 象 , 会 
发 生 什么 呢 ? 
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>>> myf = Fraction(3,5) 
>>> print (myf) 
<_ main .Fraction instance at 0x409blacc> 


Fraction 对 象 myf 并 不 知道 如 何 响 应 打印 请 求 。print 函数 要 求 对 象 将 自己 转换 成 一 个 可 
以 被 写 到 输出 端的 字符 串 。myf 唯一 能 做 的 就 是 显示 存储 在 变量 中 的 实际 引用 (地 址 本 身 )。 这 
不 是 我 们 想 要 的 结果 。 

有 两 种 办 法 可 以 解决 这 个 问题 。 一 种 是 定义 一 个 show 方法 , 使 得 Fraction 对 象 能 够 将 自 
己 作 为 字符 串 来 打印 。 代 码 清单 1-3 展示 了 该 方法 的 实现 细节 。 如 果 像 之 前 那样 创建 一 个 
Fraction 对 象 ， 可 以 要 求 它 显 示 自 己 (或 者 说 ， 用 合适 的 格式 将 自己 打印 出 来 )。 不 幸 的 是 ， 
这 种 方法 并 不 通用 。 为 了 能 正确 打印 , 我 们 需要 告诉 Fraction 类 如 何 将 自己 转换 成 字符 串 。 要 
完成 任务 ， 这 是 print 未 数 所 必需 的 。 


代码 清单 1-3 ”show 方法 


1 def show(self): 
2 print (self.num, "/", self.den) 



















































































>>> myf = Fraction(3,5) 


>>> myf.show!() 

3/5 

>>> print (myf) 

<_ main .Fraction instance at 0x40bce9ac> 
>>> 


Python 的 所 有 类 都 提供 了 一 套 标准 方法 , 但 是 可 能 没有 正常 工作 。 其 中 之 一 就 是 将 对 象 转换 
成 字符 串 的 方法 _str 。 这 个 方法 的 默认 实现 是 像 我 们 之 前 所 见 的 那样 返回 实例 的 地 址 字符 
串 。 我 们 需要 做 的 是 为 这 个 方法 提供 一 个 “更 好 ”的 实现 ， 即 重 写 默认 实现 , 或 者 说 重新 定义 该 
方法 的 行为 。 

为 了 达到 这 一 目标 ， 仪 需 定义 一 个 名 为 str 的 方法 ， 并 且 提 供 新 的 实现 ， 如 代码 清单 
1-4 所 示 。 除 了 特殊 参数 self 之 外 ， 该 方法 定义 不 需要 其 他 信息 。 新 的 方法 通过 将 两 部 分 内 部 
状态 数据 转换 成 字符 串 并 在 它们 之 间 搬 和 字符 /来 将 分 数 对 象 转换 成 字符 串 。 一 旦 要 求 
Fraction 对 象 转换 成 字符 串 ， 就 会 返回 结果 。 注 意 该 方法 的 各 种 用 法 。 


代码 清单 1-4 str 方法 


def __str__(self): 
2 return str(self.num) + "/" + str(self.den) 






































Ud 











SSS NYE EAGTONt(SS) 

>>> print (myf) 

3/5 

>>> print ("I ate", myf, "of the pizza") 
I ate 3/5 of the pizza 

>>> myf. str _() 
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3/19 

>>> str (myf) 
13X53 

>>> 


可 以 重 写 Fraction 类 中 的 很 多 其 他 方法 , 其 中 最 重要 的 一 些 是 基本 的 数学 运算 。 我 们 想 创 
建 两 个 Fraction 对 象 , 然后 将 它们 相 加 。 目前 , 如 果 试 图 将 两 个 分 数 相 加 , 会 得 到 下 面 的 结 





SS £1 = Pacetliom(tE4) 
SS £2 = Fraction(l.2,) 
>>> f1+f2 


Traceback (most recent call last): 
File "<pyshell#173>", line 1, in -toplevel- 
£f1+f2 
TypeError: unsupported operand typel(s) for +: 
'instance' and 'instance' 
a 


如 果 仔 细 研 究 这 个 错误 ， 会 发 现 加 号 + 无 法 处 理 Fraction 的 操作 数 。 

可 以 通过 重 写 Fraction 类 的 aqq ”方法 来 修正 这 个 错误 。 该 方法 需要 两 个 参数 。 第 一 个 
仍然 是 self， 第 二 个 代表 了 表达 式 中 的 另 一 个 操作 数 。 

f1. adqddq _(f2) 

以 上 代码 会 要 求 Fraction 对 象 f1 将 Fraction 对 象 £2 加 到 自己 的 值 上 。 可 以 将 其 写成 
标准 表达 式 : f1 + f2。 

两 个 分 数 需要 有 相同 的 分 母 才 能 相 加 。 确保 分 母 相 同 最 简单 的 方法 是 使 用 两 个 分 母 的 乘积 作 























a c ad cb ad+cb 
ba ba bd bd 
代码 清单 1-5 展示 了 具体 实现 。 add_ 方法 返回 一 个 包含 分 子 和 分 母 的 新 Fraction 对 象 。 
可 以 利用 这 一 方法 来 编写 标准 的 分 数 数学 表达 式 ， 将 加 法 结果 赋 给 变量 ,并且 打印 结果 。 值 得 注 
意 的 是 , 第 3 行 中 的 \ 称 作 续 行 符 。 当 一 条 Python 语句 被 分 成 多 行 时 ， 需 要 用 到 续 行 符 。 


代码 清单 1-5 adqq 方法 


























1 def _ adqd_ (self, otherfraction): 
2 
3 newnum = self.num * otherfraction.den + \ 
4 self.den * otherfraction.num 
总 newden = self.den * otherfraction.den 
6 
7 return Fraction(newnum, newden) 
> £1 SETACCLOnm(L.,. 4) 
S32 FIAGELON:(L;. -2 


28 第 1 章 导论 





RS 人 1、 2 
SS ETNE(E) 
6/8 


2 











虽然 这 一 方法 能 够 与 我 们 预想 的 一 样 执 行 加 法 运算 ,但 是 还 有 一 处 可 以 改进 。1/4+1/2 的 确 
等 于 6/8, 但 它 并 不 是 最 简 分 数 。 最 好 的 表达 应 该 是 3/4。 为 了 保证 结果 总 是 最 简 分 数 , 需要 一 个 
知道 如 何 化 简 分 数 的 辅助 方法 。 该 方法 需要 寻找 分 子 和 分 母 的 最 大 公 因 数 ( greatest common 
divisor，GCD )， 然 后 将 分 子 和 分 母 分 别 除 以 最 大 公 因 数 ， 最 后 的 结果 就 是 最 简 分 数 。 

要 寻找 最 大 公 因 数 ， 最 著名 的 方法 就 是 欧 几 里 得 算法 , 第 8 章 将 详细 讨论 。 欧 几 里 得 算法 指 
出 ， 对 于 整数 m 和 nn， 如 果 m 能 被 n 整除 ， 那么 它们 的 最 大 公 因 数 就 是 wm。 然 而 ， 如 果 m 不 能 被 
nn 整除， 那么 结果 是 n 与 m 除 以 的 余数 的 最 大 公 因 数 。 代 码 清 单 1-6 提供 了 一 个 迭代 实现 。 注 
意 ,， 这 种 实现 只 有 在 分 母 为 正 的 时 候 才 有 效 。 对 于 Fraction 类 , 这 是 可 以 接受 的 ， 因为 之 前 已 
经 定义 过 ， 负 的 分 数 带 有 负 的 分 子 ， 其 分 母 为 正 。 


代码 清单 1-6 ”geca 函数 


























































































































| def gcd (m,n): 

2 while msn != 0: 
2 Gan 二 
4 si 本 一 
5 

6 

7 

8 


SS 


号 
全 世间 
O 
EE 
人 
5 


oldm%oldn 
return n 








现在 可 以 利用 这 个 函数 来 化 简 分 数 。 为 了 将 一 个 分 数 转化 成 最 简 形 式 , 需要 将 分 子 和 分 母 都 
除 以 它们 的 最 大 公 因 数 。 对 于 分 数 6/8， 最 大 公 因 数 是 2。 因 此 ,将 分 子 和 分 母 都 除 以 2, 便 得 到 
3/4。 代 码 清 单 1-7 展示 了 实现 细节 。 


代码 清单 1-7 ”改良 版 _ aqq 方法 


def _ adq_ (self, otherfraction): 
newnum = self.num * otherfraction.den + \ 
self.den * otherfraction.num 
newden = self.den * otherfraction.den 
common = gcd(newnum, newden) 
return Fraction(newnum//common, newden//common) 








ORODP 





SS EL ,ue PEACGELON(Lr4) 
>>> f2 = Fraction(1,2) 
> 

>>> print (£3) 

3/4 


>>> 


Fraction 对 象 现在 有 两 个 非常 有 用 的 方法 ， 如 图 1-6 所 示 。 为 了 允许 两 个 分 数 互相 比较 ， 
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还 需要 添加 一 些 方法 。 假 设 有 两 个 Fraction 对 象 ，f1 和 f2。 只 有 在 它们 是 同一 个 对 象 的 引用 | 二 
时 ，f1 -= f2 才 为 rrue。 这 被 称 为 浅 相等 ， 如 图 1-7 所 示 。 在 当前 实现 中 ， 分 子 和 分 母 相 同 的 
两 个 不 同 的 对 象 是 不 相等 的 。 












myfraction 





浅 相等 





图 1-7 浅 相 等 与 深 相 等 
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通过 重 写 _eq ”方法 ,可 以 建立 深 相 等 一 一 根据 值 来 判断 相等 ， 而 不 是 根据 引用 。__ea__” 
是 又 一 个 在 任意 类 中 都 有 的 标准 方法 。 它 比较 两 个 对 象 ， 并 且 在 它们 的 值 相等 时 返回 True， 否 
则 返回 False。 

在 Fraction 类 中 ， 可 以 通过 统一 两 个 分 数 的 分 母 并 比较 分 子 来 实现 _ ed 方法， 如 代码 
清单 1-8 所 示 。 需 要 注意 的 是 ， 其 他 的 关系 运算 符 也 可 以 被 重 写 。 例 如 ，_ le ”方法 提供 判断 
小 于 等 于 的 功能 。 
代码 清单 1-8 ea 方法 
def _ eq (self, other): 


firstnum = self.num * other.den 
secondnum = other.num * self.den 


















































RODPp 


return firstnum == secondnum 





代码 清单 1-9 提供 了 到 目前 为 止 Fraction 类 的 完整 实现 。 剩余 的 算术 方法 及 关系 方法 留 作 
练习 o 


代码 清单 1-9 Fraction 类 的 完整 实现 


class Fraction: 
def __init_ _(self, top, bottom): 
self.num = top 
self.den = bottom 





def __str__(self): 
return str(self.num) + "/" + str(self.den) 


oJIAUURARODPP 


def show(self): 
print (self.num, "/", self.den) 


def _ adqd_ (self, otherfraction): 
newnum = Self.num * otherfraction.den + \ 
self.den * otherfraction.num 
newden = self.den * otherfraction.den 
common = gcd(newnum, newden) 
return Fraction(newnum//common, newden//common) 


COORD PO 





‘Oo 


def __ eq (self，other) : 
firstnum = self.num * other.den 
secondnum = other.num * self.den 


CO CD NI 
人 


DD 
[9] 


return firstnum == Secondnum 





2. 继承 : 逻辑 门 与 电路 
最 后 一 节 介绍 面向 对 象 编程 的 另 一 个 重要 方面 。 继 承 使 一 个 类 与 另 一 个 类 相关 联 ,就 像 人 们 
相互 联系 一 样 。 孩 子 从 父母 那里 继承 了 特征 。 与 之 类 似 , Python 中 的 子 类 可 以 从 父 类 继承 特征 数 
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据 和 行为 。 父 类 也 称 为 超 类 。 

图 1-8 展示 了 内 建 的 Python 集合 类 以 及 它们 的 相互 关系 。 我 们 将 这 样 的 关系 结构 称 为 继承 层次 
结构 。 举 例 来 说 ， 列 表 是 有 序 集 合 的 子 。 因 此 ， 我 们 将 列表 称 为 子 ， 有 序 集合 称 为 父 〈 或 者 分 别称 
为 子 类 列表 和 超 类 序列 )。 这 种 关系 通常 被 称 为 IS-A 关系 (IS-A 意 即 列表 在 一 人 有 序 集合 )。 这 意味 
着 , 列表 从 有 序 集合 继承 了 重要 的 特征 , 也 就 是 内 部 数据 的 顺序 以 及 诸如 拼接 、 重 复 和 索引 等 方法 。 
































Python 集合 类 


























图 1-8 Python 集合 类 的 继承 层次 结构 


列表 、 字 符 串 和 元 组 都 是 有 序 集合 。 它 们 都 继承 了 共同 的 数据 组 织 和 操作 。 不 过 ,根据 数据 
是 否 同 类 以 及 集合 是 否 可 修改 ,它们 彼此 又 有 区 别 。 子 类 从 父 类 继承 共同 的 特征 , 但 是 通过 额外 
的 特征 彼此 区 分 。 

通过 将 类 组 织 成 继承 层次 结构 , 面向 对 象 编程 语言 使 以 前 编写 的 代码 得 以 扩展 到 新 的 应 用 场 
景 中 。 此 外 ， 这 种 结构 有 助 于 更 好 地 理解 各 种 关系 ， 从 而 更 高 效 地 构建 抽象 表示 。 

为 了 进一步 探索 这 个 概念 ,我 们 来 构建 一 个 模拟 程序 , 用 于 模拟 数字 电路 。 逻 辑 门 是 这 个 模 
拟 程序 的 基本 构造 单元 , 它们 代表 其 输入 和 输出 之 间 的 布尔 代数 关系 。 一 般 来 说 ,逻辑 门 都 有 单 
一 的 输出 。 输 出 值 取决 于 提供 的 输入 值 。 

与 门 (AND gate ) 有 两 个 输入 ， 每 一 个 都 是 0 或 1 (分 别 代 表 False 和 True )。 如 果 两 个 
输入 都 是 1， 那 么 输出 就 是 1; 如 果 至 少 有 一 个 输入 是 0， 那 么 输出 就 是 0。 或 门 (OR gate ) 同 
样 也 有 两 个 输入 。 当 至 少 有 一 个 输入 为 1 时， 输出 就 为 1; 当 两 个 输入 都 是 0 时 ， 输 出 是 0。 

非 门 (NOT gate ) 与 其 他 两 种 逻辑 门 不 同 ， 它 只 有 一 个 输入 。 输 出 刚好 与 输入 相反 。 如 果 输 
和 是 0, 输出 就 是 1。 反之 , 如 果 输 入 是 1, 输出 就 是 0。 图 1-9 展示 了 每 一 种 逻辑 门 的 表示 方法 。 
每 一 种 都 有 一 张 真 值 表 ， 用 于 展示 输入 与 输出 的 对 应 关系 。 





























































































































与 门 











图 1-9 3 种 逻辑 门 


通过 不 同 的 模式 将 这 些 逻 辑 门 组 合 起 来 并 提供 一 系列 输入 值 ， 可 以 构建 具有 逻辑 功能 的 电 
路 。 图 1-10 展示 了 一 个 包含 两 个 与 门 、 一 个 或 门 和 一 个 非 门 的 电路 。 两 个 与 门 的 输出 直接 作为 
输入 传 给 或 门 ， 然 后 其 输出 又 输入 给 非 门 。 如 果 在 4 个 输入 处 ( 每 个 与 门 有 两 个 输入 ) 提供 一 系 


列 值 ， 那 么 非 门 就 会 输出 结果 。 图 1-10 也 展示 了 这 一 过 程 。 





图 1-10 

















电路 示例 








为 了 实现 电路 ,首先 需要 构建 逻辑 门 的 表示 。 可 以 轻松 地 将 逻辑 门 组 织 成 类 的 继承 层次 结构 ， 
如 图 1-11 所 示 。 顶 部 的 LogicGate 类 代表 逻辑 门 的 通用 特性 : 逻辑 门 的 标签 和 一 个 输出 。 下 面 
一 层 子 类 将 逻辑 门 分 成 两 种 : 有 一 个 输入 的 逻辑 门 和 有 两 个 输入 的 逻辑 门 。 再 往 下 ， 就 是 具体 的 


逻辑 门 。 
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BinaryGate 






LogicGate 





MW Ss 





图 1-11 兆 辑 门 的 继承 层次 结构 





现在 开始 通过 实现 最 通用 的 类 LogicGat 


e 来 实现 这 些 类 。 如 前 所 述 ， 每 一 个 逻辑 门 都 有 一 


个 用 于 识别 的 标签 以 及 一 个 输出 。 此 外 ， 还 需要 一 些 方法 ， 以 便 用 户 获 取 逻 辑 门 的 标签 。 
所 有 逮 辑 门 还 需要 能 够 知道 自己 的 输出 值 。 这 就 要 求 逻 辑 门 能 够 根据 当前 的 输入 值 进行 合理 


的 逻辑 运算 。 为 了 生成 结果 ,逻辑 门 需要 知道 





自己 对 应 的 逻辑 运算 是 什么 。 这 意味 着 需要 调用 





个 方法 来 进行 逻辑 运算 。 代 码 清单 1-10 展示 了 LogicGate 类 的 完整 实现 。 


代码 清单 1-10” 超 类 LogicGate 





class LogicGate: 


于 

2 

3 def init2 (SelLf, 省 让: 
4 self.label = n 

5 self.output = None 
6 
7 
8 


def getLabel (self): 
return self.label 


10 def getOutput (self): 
1 self.output = self.performGat 
2 return self.output 


eLogic() 





目前 还 不 用 实现 performGateLogic 国 数 。 原 因 在 于 ， 我 们 不 知道 每 一 种 逻辑 门将 如 何 进 


行 自己 的 逻辑 运算 。 这些 细 节 会 交 由 继承 层次 


结构 中 的 每 一 个 逻辑 门 来 实现 。 这 是 一 种 在 面向 对 

















和 象 编程 中 非常 强大 的 思想 一 一 我 们 创建 了 一 个 方法 ,而 其 代码 还 不 存在 。 参 数 self 是 指向 实际 
调用 方法 的 逻辑 门 对 象 的 引用 。 任何 添加 到 继承 层次 结构 中 的 新 逻辑 门 都 仅 需 要 实现 之 后 会 被 调 
用 的 performGateLogic 函数 。 一 旦 实现 完成 ， 逻 辑 门 就 可 以 提供 运算 结果 。 扩 展 已 有 的 继承 
层次 结构 并 提供 使 用 新 类 所 需 的 特定 函数 ， 这 种 能 力 对 于 重用 代码 来 说 非常 重要 。 





我 们 依据 输入 的 个 数 来 为 逻辑 门 分 类 。 





与 门 和 或 门 有 两 个 输入 ， 非 门 只 有 一 个 输入 。 








BinaryGate 是 LogicGate 的 一 个 子 类 ,并 | 


昌 有 两 个 输入 。UnaryGate 同样 是 LogicGate 的 
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子 类 ， 但 是 仅 有 一 个 输入 。 在 计算 机 电路 设计 中 ， 这 些 输入 被 称 作 “ 引 脚 ”( pin )， 我 们 在 实现 
中 也 使 用 这 一 术语 。 

代码 清单 1-11 和 代码 清单 1-12 实现 了 这 两 个 类 。 两 个 类 中 的 构造 方法 首先 使 用 super 函数 
来 调用 其 父 类 的 构造 方法 。 当 创建 BinaryGate 类 的 实例 时 ， 首 先 要 初始 化 所 有 从 LogicGate 
中 继承 来 的 数据 项 ,在 这 里 就 是 逻辑 门 的 标签 。 接 着 , 构造 方法 添加 两 个 输入 (pinA 和 pinB )。 
这 是 在 构建 类 继承 层次 结构 时 常用 的 模式 。 子 类 的 构造 方法 需要 先 调用 父 类 的 构造 方法 , 然后 再 
初始 化 自己 独 有 的 数据 。 


代码 清单 1-11 BinaryGate 类 


















































让 class BinaryGate (LogicGate): 

2 

3 def __init_ _(self, n): 

4 super().__ init _(n) 

5S. 

6 self.pinA = None 

7 self.pinB = None 

8 

9 def getPinA(self): 

10 return int(input ("Enter Pin A input for gate " + \ 
| 二 self.getLabel() + "-->")) 

下 这 

13 def getPinB (self): 

14 return int (input ("Enter Pin B input for gate " + \ 
二 全 self.getLabel() + "-->")) 





代码 清单 1-12 ”UnaryGate 类 





class UnaryGate (LogicGate): 


def = ‘init (Self; Mm}: 
Super(). init _(n) 


self.pin = None 


def getPin(self): 
return int(input ("Enter Pin input for gate " + \ 


a 
2 
3 
4 
5 
6 
7 
8 
9 
10 self.getLabel() + "-->")) 














BinaryGate 类 增添 的 唯一 行为 就 是 取得 两 个 输入 值 。 由 于 这 些 值 来 自 于 外 部 ， 因 此 通过 一 
条 输入 语句 来 要 求 用 户 提 供 。UnaryGate 类 也 有 类 似 的 实现 ， 不 过 它 只 有 一 个 输入 。 

有 了 不 同 输入 个 数 的 逻辑 门 所 对 应 的 通用 类 之 后 ,就 可 以 为 有 独特 行为 的 逻辑 门 构建 类 。 例 
如 ， 由 于 与 门 需要 两 个 输入 ， 因 此 AndGate 是 BinaryGate 的 子 类 。 和 之 前 一 样 ， 构 造 方法 的 
第 一 行 调用 父 类 ( BinaryGate ) 的 构造 方法 ， 该 构造 方法 又 会 调用 它 的 父 类 (LogicGate ) 的 
构造 方法 。 注 意 ， 由 于 继承 了 两 个 输入 、 一 个 输出 和 逻辑 门 标签 ， 因 此 AndGate 类 并 没有 添加 
任何 新 的 数据 。 
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AndGate 类 唯一 需要 添加 的 是 布尔 运算 行为 。 这 就 是 提供 performcateLogic 的 地 方 。 对 


于 与 门 来 说 ，performcateLogic 首先 需要 获取 两 个 输入 值 ， 然 后 只 有 在 它们 都 为 1 时 返回 1。 
代码 清单 1-13 展示 了 AndGate 类 的 完整 实现 。 


代码 清单 1-13 AndqGate 类 








1 
2 
2 
4 
3 
6 
3 
8 


9 

10 
11 
12 
13 


class AndGate (BinaryGate): 


def _ init__(self, n): 
super()._ init _(n) 


def performGateLogic (self): 


a = self.getPinA() 
b = self.getPinB() 
fa==1, and -b==L 
return 1 
else: 
return 0 





可 以 创建 一 个 实例 来 验证 AndGate 类 的 行为 。 下 面 的 代码 展示 了 AndGate 对 象 g1， 它 有 


一 个 内 部 标签 “G1”。 当 调 用 getoutput 方法 时 , 该 对 象 必须 首先 调用 它 的 performGateLogic 


方法 ， 这 个 方法 会 获取 两 个 输入 值 。 一 旦 取得 输入 值 ， 就 会 显示 正确 的 结果 。 








>>> gl1 = AndGate("G1") 

>>> g1.getoutput () 

Enter Pin A input for gate G1-->1 
Enter Pin B input for gate G1-->0 
0 


或 门 和 非 门 都 能 以 相同 的 方式 来 构建 。orGate 也 是 BinaryGate 的 子 类 ，NotGate 则 会 继 


tH 


hl 





承 UnaryGate 类 。 由 于 计算 逻辑 不 同 ， 这 两 个 类 都 需要 提供 自己 的 performcateLogic 畏 数 。 


要 使 用 逻辑 门 ， 可 以 先 构建 这 些 类 的 实例 ， 然 后 查询 结果 ( 这 需要 用 户 提供 输入 )。 


>>> g2 = OrGate("G2") 

>>> g2.getOutput() 

Enter Pin A input for gate G2-->1 
Enter Pin B input for gate G2-->1 
于 

>>> g2.getOutput() 

Enter Pin A input for gate G2-->0 
Enter Pin B input for gate G2-->0 
0 

>>> g3 = NotGate("G3") 

>>> g3 .getOutput() 

Enter Pin input for gate G3-->0 








有 了 基本 的 逻辑 门 之 后 , 便 可 以 开始 构建 电路 。 为 此 , 需要 将 逻辑 门 连接 在 一 起 ,前 一 个 的 

















输出 是 后 一 个 的 输入 。 为 了 做 到 这 一 点 ， 我 们 要 实现 一 个 叫 作 connector 的 新 类 。 
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Connector 类 并 不 在 逻辑 门 的 继承 层次 结构 中 。 但 是 ， 它 会 使 用 该 结构 ， 从 而 使 每 一 个 连 
接 器 的 两 端 都 有 一 个 逻辑 门 《 如 图 1-12 所 示 )。 这 被 称 为 HAS-A 关系 (HAS-A 意 即 “有 一 个 ”)， 
它 在 面向 对 象 编程 中 非常 重要 。 前文 用 IS-A 关系 来 描述 子 类 与 父 类 的 关系 , 例如 UnaryGate 是 


一 个 LogicGate。 


fromgate 


过 深 训 togate 


图 1-12 连接 器 将 一 个 逻辑 门 的 输出 与 男 一 个 逻辑 门 的 输入 连接 起 来 





























Connector 与 LogicGate 是 HAS-A 关 系 。 这 意味 着 连接 器 内 部 包含 rogicGate 类 的 实例 ， 
但 是 不 在 继承 层次 结构 中 。 在 设计 类 时 ， 区 分 IS-A 关系 (需要 继承 ) 和 HAS-A 关系 (不 需要 继 
承 ) 非常 重要 。 

代码 清单 1-14 展示 了 connector 类 。 每 一 个 连接 器 对 象 都 包含 fromgate 和 togate 两 个 
逻辑 门 实例 ， 数 据 值 会 从 一 个 逻辑 门 的 输出 “流向 ”下 一 个 逻辑 门 的 输入 。 对 setNextPin 的 
调用 (实现 如 代码 清单 1-15 所 示 ) 对 于 建立 连接 来 说 非常 重要 。 需 要 将 这 个 方法 添加 到 逻辑 门 
类 中 ， 以 使 每 一 个 togate 能 够 选择 适当 的 输入 。 


代码 清单 1-14 connector 类 














1 class Connector: 

2 

3 def _ init_ _(self, fgate, tgate): 
4 self.fromgate = fgate 

人 self.togate = tgate 

6 
7 
8 


tgate.setNextPin (self) 


9 def getFrom(self): 

10 return self.fromgate 
11 

直流 def getTo(self): 

于 3 return self.togate 





代码 清单 1-15 ”setNextPin 方法 





J]: def setNextPin(self, source): 
2 if self.pinA == None: 

3 self.pinA = source 

4 else: 

5 if self.pinB == None: 
6 self.pinB = source 





7 else: 
8 raise RuntimeError("Error: NO EMPTY PINS") 








在 BinaryGate 类 中 ， 逮 辑 门 有 两 个 输入 ， 但 连接 器 必须 只 连接 其 中 一 个 。 如 果 两 个 都 能 
连接 , 那么 默认 选择 pinA。 如 果 pinA 已 经 有 了 连接 , 就 选择 pinB。 如 果 两 个 输入 都 已 有 连接 ， 
则 无 法 连接 逻辑 门 。 

现在 的 输入 来 源 有 两 个 :外 部 以 及 上 一 个 逻辑 门 的 输出 。 这 需要 对 方法 get PinA 和 getPinB 
进行 修改 〈 请 参考 代码 清单 1-16 )。 如 果 输 入 没有 与 任何 逻辑 门 相 连接 (None )， 那 就 和 之 前 一 
样 要求 用 户 输入 。 如 果 有 了 连接 ， 就 访问 该 连接 并 且 获 取 fromgate 的 输出 值 。 这 会 触发 
fromgate 处 理 其 逻辑 。 该 过 程 会 一 直 持续 ,直到 获取 所 有 输入 并 且 最 终 的 输出 值 成 为 正在 查询 
的 逻辑 门 的 输入 。 在 某 种 意义 上 ， 这 个 电路 反 向 工作 ， 以 获得 所 需 的 输入 ， 再 计算 最 后 的 结果 。 


代码 清单 1-16 ”修改 后 的 getPina 方法 





























J def getPinA(self): 

2 if self.pinA == None: 

3 return input ("Enter Pin A input for gate " + \ 
4 self.getName() + "-->") 

5 else: 

6 return self.pinA.getFrom() .getOutput() 





下 面 的 代码 段 构 造 了 图 1-10 中 的 电路 。 


>>> gl = AndGate("G1") 
>>> g2 = AndGate ("G2") 
>>> g3 = OrGate("G3") 
>>> g4 = NotGate("G4") 
>>> cl = Connector(gl, g3) 
>>> Cc2 = Connector(g2, 9g3) 
>>> c3 = Connector(g3, 9g4) 


两 个 与 门 (gl 和 g2 ) 的 输出 与 或 门 (g3 ) 的 输入 相连 接 , 或 门 的 输出 又 与 非 门 (g4 ) 的 输 
入 相连 接 。 非 门 的 输出 就 是 整个 电路 的 输出 。 


>>> g4.getOutput() 

Pin A input for gate G1-->0 
Pin B input for gate G1-->1 
Pin A input for gate G2-->1 
Pin B input for gate G2-->1 
0 


六 六 六 





1.5 小结 


口 计算 机 科学 是 研究 如 何 解决 问题 的 学 科 。 
口 计算 机 科学 利用 抽象 这 一 工具 来 表示 过 程 和 数据 。 
口 抽象 数据 类 型 通过 隐藏 数据 的 细节 来 使 程序 员 能 够 管理 问题 的 复杂 度 。 









































口 Python 是 一 门 强大 、 易 用 的 面向 对 象 编程 语言 。 

口 列表 、 元 组 以 及 字符 串 是 Python 的 内 建 有 序 集合 。 
口 字典 和 集 是 无 序 集合 。 
口 类 使 得 程序 员 能 够 实现 抽象 数据 类 型 。 

口 程序 员 既 可 以 重 写 标准 方法 ， 也 可 以 构建 新 的 方法 。 

口 类 可 以 通过 继承 层次 结构 来 组 织 。 

口 类 的 构造 方法 总 是 先 调 用 其 父 类 的 构造 方法 ,然后 才 处 理 自己 的 数据 和 行为 。 













































































1.6 关键 术语 








HAS-A 关系 IS-A 关系 self 
编程 超 类 抽象 

抽象 数据 类 型 独立 于 实现 对 象 
方法 封装 格式 化 运算 符 
格式 化 字符 串 过 程 抽 象 继承 
继承 层次 结构 接口 可 计算 
可 修改 性 类 列表 
列表 解析 式 模拟 浅 相 等 
深 相 等 数据 抽象 数据 结构 
数据 类 型 算法 提示 符 
信息 隐藏 异常 真 值 表 
子 类 字典 字符 串 


1.7 ”讨论 题 


1. 为 校园 里 的 人 构建 一 个 继承 层次 结构 , 包括 教职员 工 及 学 生 。 他 们 有 何 共同 之 处 ? 又 有 
何 区 别 ? 


2. 为 银行 账户 构建 一 个 继承 层次 结构 。 
3. 为 不 同类 型 的 计算 机 构建 一 个 继承 层次 结构 。 
4. ”利用 本 章 提 供 的 类 ， 以 交互 方式 构建 一 个 电路 并 对 其 进行 测试 。 


1.8 ”编程 练习 


1. 实现 简单 的 方法 getNum 和 getDen， 它 们 分 别 返 回 分 数 的 分 子 和 分 母 。 


2. ”如 果 所 有 分 数 从 一 开始 就 是 最 简 形 式 会 更 好 。 修 改 Fraction 类 的 构造 方法 ， 立 即使 
用 最 大 公 因 数 来 化 简 分 数 。 注 意 ， 这 意味 着 ado 不 再 需要 化 简 结 果 。 
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实现 下 列 简单 的 算术 运算 : SU mul 和 truediv 。 

实现 下 列 关 系 运算 : _ gt 、_ ge 、 It 、 le 和 ne 。 

修改 Fraction 类 的 构造 方法 ， 使 其 检查 并 确保 分 子 和 分 母 均 为 整数 。 如 果 任 一 不 是 
整数 ， 就 抛 出 异常 。 

我 们 假设 负 的 分 数 是 由 负 的 分 子 和 正 的 分 母 构成 的 。 使 用 负 的 分 母 会 导致 某 些 关 系 运算 
符 返 回 错误 的 结果 。 一 般 来 说 , 这 是 多 余 的 限制 。 请 修改 构造 方法 , 使 得 用 户 能 够 传人 
负 的 分 母 ， 并且 所 有 的 运算 符 都 能 返回 正确 的 结 


研究 ”radd 方法。 它 与 _ad9 方法 有 何 区 别 ? 何 时 应 该 使 用 它 ? 请 动手 实现 
add.. :5 
































[ 究 _iadd 方法 。 它 与 _adda 方法 有 何 区 别 ? 何 时 应 该 使 用 它 ? 请 动手 实现 
iadd 。 
研究 ”repr ”方法 。 它 与 _str 方法 有 何 区 别 ? 何 时 应 该 使 用 它 ? 请 动手 实现 


repr_ _。o 




















[ 究 其 他 类 型 的 逻辑 门 ( 例如 与 非 门 、 或 非 门 、 异 或 门 )。 将 它们 加 入 电路 的 继承 层次 
结构 。 你 需要 额外 添加 多 少 代码 ? 








| 


， 最 简单 的 算术 电路 是 半 加 器 。 研 究 简单 的 半 加 器 电路 并 实现 它 。 

















将 半 加 器 电路 扩展 为 8 位 的 全 加 器 。 

本 章 展示 的 电路 模拟 是 反 向 工作 的 。 换 名 话说 , 给 定 一 个 电路 , 其 输出 结果 是 通过 反 向 
访问 输入 值 来 产生 的 , 这 会 导致 其 他 的 输出 值 被 反 向 查询 。 这 个 过 程 一 直 持 续 到 外 部 输 
入 值 被 找到 ， 此 时 用 户 会 被 要 求 输入 数值 。 修改 当前 的 实现 , 使 电路 正 向 计算 结果 。 当 
收 到 输入 值 的 时 候 ， 电 路 就 会 生成 输出 结果 。 

设计 一 个 表示 一 张 扑克 有 牌 的 类 , 以 及 一 个 表示 一 副 扑 克 牌 的 类 。 使 用 这 两 个 类 实现 你 最 
喜欢 的 扑克 牌 游 戏 。 

在 报纸 上 找到 一 个 数 独 游戏 ， 并 编写 一 个 程序 求解 。 
























































算法 分 析 








2.1 本 章 目标 


口 理解 算法 分 析 的 重要 性 。 

口 能 够 使 用 大 0 符号 描述 执行 时 间 。 

口 针对 Python 列表 和 字典 的 常见 操作 ， 理 解 用 大 0 符号 表示 的 执行 时 间 。 
口 理解 Python 数据 的 实现 如 何 影 响 算法 分 析 。 

口 理解 如 何 对 简单 的 Python 程序 进行 基准 测试 。 


2.2 何谓 算法 分 析 


刚 接触 计算 机 科学 的 同学 常常 拿 自己 的 程序 和 别人 的 做 比较 。 你 可 能 已 经 注意 到 了 ,计算 机 
旦 序 看 起 来 很 相似 ， 尤 其 是 简单 的 程序 。 这 就 产生 了 一 个 有 趣 的 问题 当 两 个 看 上 去 不 同 的 程序 
解决 同一 个 问题 时 ， 会 有 优 劣 之 分 么 ? 

要 回答 这 个 问题 , 需要 记 住 ,程序 和 它 所 代表 的 算法 是 不 同 的 。 第 1 章 说 过 , 算法 是 为 逐步 
解决 问题 而 设计 的 一 系列 通用 指令 。 给 定 某 个 输入 , 算法 能 得 到 对 应 的 结 算法 就 是 解决 问 
题 的 方法 。 程序 则 是 用 某 种 编程 语言 对 算法 编码 。 同 一 个 算法 可 以 对 应 许多 程序 , 这 取决 于 程序 
员 和 编程 语言 。 

为 了 进一步 说 明 算法 和 程序 的 区 别 , 来 看 看 代码 清单 2-1 中 的 函数 。 该 函数 解决 了 一 个 常见 
的 问题 ， 即 计算 前 个 整数 之 和 。 算 法 的 思路 是 使 用 一 个 初始 值 为 0 的 累加 器 变量 ， 然 后 遍历 n 
个 整数 ， 并 将 值 加 到 累加 器 上 。 


代码 清单 2-1 计算 前 个 整数 之 和 
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J def sumOfN(n): 
多 theSum = 0 
3 for i in range(1l, n+1): 
4 theSum = theSum + i 
5 
6 


return theSum 
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下 面 看 看 代码 清单 2-2。 乍 看 会 觉得 有 些 奇怪 ， 但 是 仔细 观察 后 ， 你 会 发 现 这 个 函数 所 做 的 
工作 在 本 质 上 和 前 一 个 相同 。 之 所 以 不 能 一 眼看 出 来 ,是 因为 代码 写 得 太 差 。 没 有 用 好 的 变量 
提高 可 读 性 ， 而 且 在 累加 时 还 使 用 了 一 条 多 余 的 赋值 语句 。 


代码 清单 2-2 计算 前 个 整数 之 和 的 男 一 种 写法 























4 def foo (tom) : 

2 fred = 0 

六 for bill in zange(1，tom+1) : 
4 barney = bill 

5 fred = fred + barney 

6 
7 


return fred 























前 面 提出 过 一 个 问题 :程序 是 否 有 优 劣 之 分 ? 答案 取决 于 你 的 标准 。 如 果 你 关心 的 是 可 读 性 ， 
那么 sumofN 当然 比 foo 更 好 。 实 际 上 ， 你 可 能 已 经 在 编程 人 门 课 上 看 过 很 多 例子 ， 毕 竟 和 人 门 
课 的 一 个 目标 就 是 帮 你 写 出 易 读 的 程序 。 不 过 ， 除 了 可 读 性 ， 本 书 还 对 描述 算法 感 兴趣 。( 我 们 
当然 希望 你 继续 向 着 写 出 易 读 代码 的 目标 努力 。) 

算法 分 析 关 心 的 是 基于 所 使 用 的 计算 资源 比较 算法 。 我 们 说 甲 算 法 比 乙 算法 好 , 依据 是 甲 算 
法 有 更 高 的 资源 利用 率 或 使 用 更 少 的 资源 。 从 这 个 角度 来 看 ， 上 面 两 个 函数 其 实 差不多 , 它们 本 
质 上 都 利用 同一 个 算法 解决 累加 问题 。 

计算 资源 究竟 指 什 么 ”思考 这 个 问题 很 重要 。 有 两 种 思考 方式 。 一 是 考虑 算法 在 解决 问题 时 
要 占用 的 空间 或 内 存 。 解决 方案 所 需 的 空间 总 量 一 般 由 问题 实例 本 身 决定 , 但 算法 往往 也 会 有 特 
定 的 空间 需求 ， 后 文 会 详细 介绍 。 

另 一 种 思考 方式 是 根据 算法 执行 所 需 的 时 间 进 行 分 析 和 比较 。 这 个 指标 有 时 称 作 算法 的 执行 
时 间或 运行 时 间 。 要 衡量 sumofN 函数 的 执行 时 间 ， 一 个 方法 就 是 做 基准 分 析 。 也 就 是 说 ,我们 
会 记录 程序 计算 出 结果 所 消耗 的 实际 时 间 。 在 Python 中 ， 我 们 记录 下 函数 就 所 处 系统 而 言 的 开 
台 时 间 和 结束 时 间 。time 模块 中 有 一 个 time 函数 ， 它 会 以 秒 为 单位 返回 自 指定 时 间 点 起 到 当 
前 的 系统 时 钟 时 间 。 在 首尾 各 调用 一 次 这 个 函数 ,计算 差 值 , 就 可 以 得 到 以 秒 为 单位 的 执行 时 间 
( 多数 情 况 下 非常 短 )。 

在 代码 清单 2-3 中 ，sumOfN 函数 在 累加 前 后 调用 time。 函 数 返 回 一 个 元 组 ， 由 结果 与 计算 
时 间 (单位 为 秒 ) 构成 。 如 果 调 用 5 次 ， 每 次 计算 前 10 000 个 整数 之 和 ， 会 得 到 如 下 结果 。 

I i required %10.7f seconds" % sumOfN(10000)) 

Sum is 50005000 required .0018950 seconds 

Sum is 50005000 required .0018620 seconds 

Sum is 50005000 required .0019171 seconds 


Sum is 50005000 required .0019162 seconds 
Sum is 50005000 required .0019360 seconds 
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代码 清单 2-3 ”计算 执行 时 间 





1 import time 

| 

3 def sumOfN2 (n): 

4 start = time.time!() 

5 

6 theSum = 0 

7 for i in range(1，Dn+1) : 
8 theSum = theSum + i 
9 

10 end = time.time!() 

下 业 

12 return theSum, end-start 





可 以 看 出 , 执行 时 间 基 本 上 是 一 致 的 , 平均 约 为 0.0019 秒 。 如果 计算 前 100 000 个 整数 之 和 ， 
又 会 如 何 呢 ? 


>>> for i in range(5): 
print ("Sum is %d required %10.7f seconds" % sumOfN(100000)) 

Sum is 5000050000 required 0.0199420 seconds 

Sum is 5000050000 required .0180972 seconds 

Sum is 5000050000 required .0194821 seconds 

Sum is 5000050000 required .0178988 seconds 

Sum is 5000050000 required .0188949 seconds 

>>> 


执行 时 间 都 变 长 了 , 但 还 是 很 一 致 ， 差 不 多 都 是 之 前 的 10 倍 。 如果 n 取 1000000, 结果 如 下 。 


>>> for i in range(5) : 
print ("Sum is %d required %10.7f seconds" % sumOfN(1000000)) 

Sum is 500000500000 required 0.1948988 seconds 

Sum is 500000500000 required 0.1850290 seconds 

Sum is 500000500000 required 0.1809771 seconds 

Sum is 500000500000 required .1729250 seconds 

Sum is 500000500000 required .1646299 seconds 

pe 


这 次 的 平均 执行 时 间 差 不 多 是 前 一 个 例子 的 10 倍 。 


现在 来 看 看 代码 清单 2-4, 其 中 给 出 了 解决 累加 问题 的 新 方法 。 函数 sumofN3 使 用 以 下 公式 
计算 前 n 个 整数 之 和 ， 不 必 使 用 循环 。 


0 
0 
0 
0 

















er 























Se 
代码 清单 -4 不 使 用 循环 来 计算 前 个 整数 之 和 


1 def sumOfN3 (n): 
2 return (nx (n+1))/2 








对 sumofN3 做 同样 的 基准 测试 ,na 取 5 个 值 (10 000、100 000、1 000 000、10 000 000 和 
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100 000 000 )， 会 得 到 以 下 结果 。 

Sum is 50005000 required 0.00000095 seconds 

Sum is 5000050000 required 0.00000191 seconds 

Sum is 500000500000 required 0.00000095 seconds 

Sum is 50000005000000 required 0.00000095 seconds 

Sum is 5000000050000000 required 0.00000119 seconds 

关于 这 个 结果 ， 有 两 点 要 注意 。 首 先 , 记录 的 耗 时 比 之 前 的 例子 都 要 短 。 其 次 ,不管 a 取 什 
么 值 ， 耗 时 都 很 稳定 。 看 起 来 sumofN3 不 太 受 整数 数目 的 影响 。 


不 过 ,以 上 基准 测试 结果 的 意义 到 底 是 什么 呢 ? 直觉 上 ,循环 方案 看 上 去 工作 量 更 大 ， 因 为 
有 些 步 又 重复 。 这 好 像 是 耗 时 更 久 的 原因 。 而 且 ， 循 环 方案 的 耗 时 会 随 着 n 一 起 增长 。 然 而 ,这 
里 有 个 问题 。 如 果 在 男 一 台 计算 机 上 运行 这 个 函数 , 或 用 男 一 种 编程 语言 来 实现 , 很 可 能 会 得 到 
不 同 的 结果 。 如 果 计 算 机 再 旧 些 ，sumofN3 的 执行 时 间 甚 至 更 长 。 

所 以 ,我 们 需要 更 好 的 方式 来 描述 算法 的 执行 时 间 。 基 准 测试 计算 的 是 执行 算法 的 实际 时 间 。 
这 不 是 一 个 有 用 的 指标 ， 因 为 它 依赖 于 特定 的 计算 机 、 程 序 、 时 间 、 编 译 吉 与 编程 语言 。 我 们 希 
望 找到 一 个 独立 于 程序 或 计算 机 的 指标 。 这 样 的 指标 在 评价 算法 方面 会 更 有 用 , 可 以 用 来 比较 不 
同 实现 下 的 算法 。 





















































2.2.1 大 O 记 法 


试图 摆脱 程序 或 计算 机 的 影响 而 描述 算法 的 效率 时 , 量化 算法 的 操作 或 步 又 很 重要 。 如 果 将 
每 一 步 看 成 基本 计算 单位 , 那么 可 以 将 算法 的 执行 时 间 描 述 成 解决 问题 所 需 的 步 又 数 。 确 定 合适 
的 基本 计算 单位 很 复杂 ， 也 依赖 于 算法 的 实现 。 

对 于 累加 算法 ， 计 算 总 和 所 用 的 赋值 语句 的 数目 就 是 一 个 很 好 的 基本 计算 单位 。 在 sumofN 
函数 中 ， 赋 值 语句 数 是 1 (thesum = 0 ) 加 上 7 (thesum = theSum + i 的 运行 次 数 )， 可 以 
将 其 定义 成 函数 了 ,， 令 TCD) =1+7 。 人 参数 半 常 被 称 作 问 题 规模 ， 可 以 将 函数 解读 为 “ 当 问 题 规模 
为 n 时 ， 解决 问题 所 需 的 时 间 是 7T(n) ， 即 需要 1+n 步 ”。 

在 前 面 给 出 的 累加 水 数 中 ,用 累加 次 数 定义 问题 规模 是 合理 的 。 这 样 一 来 ,就 可 以 说 处 理 前 
100 000 个 整数 的 问题 规模 比 处 理 前 1000 个 整数 的 大 。 鉴 于 此 ， 前 者 花 的 时 间 要 比 后 者 长 。 接 下 
来 的 目标 就 是 揭示 算法 的 执行 时 间 如 何 随 问题 规模 而 变化 。 

计算 机 科学 家 将 分 析 向 前 推进 了 一 步 。 精 确 的 步骤 数 并 没有 7(m) 函数 中 起 决定 性 作用 的 部 
分 重要 。 也 就 是 说 ， 随 着 问题 规模 的 增长 ，7(n) 函数 的 某 一 部 分 会 比 其 余部 分 增长 得 更 快 。 最 
后 比较 的 其 实 就 是 这 一 起 决定 性 作用 的 部 分 。 数量级 函数 捅 述 的 就 是 ， 当 nn 增长 时 ，7T(n) 增 长 最 
快 的 部 分 。 数 量 级 ( order of magnitude ) 常 被 称 作 大 0O 记 法 (O 指 order )， 记 作 O(f(n))。 它 提 
供 了 步骤 数 的 一 个 有 用 的 近似 方法 。 f(n) 函数 为 T(n) 函数 中 起 决定 性 作用 的 部 分 提供 了 简单 的 
表示 。 
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对 于 7(n)=1+n ， 随 着 越 来 越 大 ， 常 数 1 对 最 终结 果 的 影响 越 来 越 小 。 如 果 要 给 出 7T(n) 的 
近似 值 ， 可 以 舍 去 1 ， 直 接 说 执行 时 间 是 O(n) 。 注 意 ，1 对 于 7(n) 来 说 是 重要 的 。 但 是 随 着 n 的 
增长 ， 没 有 1 也 不 会 太 影响 近似 值 。 

再 举 个 例子 ,假设 某 算法 的 步骤 数 是 T(n) =5n? +27n+1005 。 当 很 小 时 ， 比 如 说 1 或 2 ， 
常数 1005 看 起 来 是 这 个 函数 中 起 决定 性 作用 的 部 分 。 然 而 ， 随 着 n 增长 ，n? 变 得 更 重要 。 实 际 
上 , 当 n 很 大 时 , 另 两 项 的 作用 对 于 最 终结 果 来 说 就 不 显著 了 , 因此 可 以 忽略 这 两 项 , 只 关注 5n? 。 
另外 ， 当 nn 变 大 时 ,系数 5 的 作用 也 不 显著 了 。 因 此 可 以 说 ,函数 7T(n) 的 数量 级 是 f(n)=n? ,或 
者 直接 说 是 O(n?) 。 

累加 的 例子 没有 体现 的 一 点 是 ， 算 法 的 性 能 有 时 不 仅 依赖 于 问题 规模 ， 还 依赖 于 数据 值 。 
对 于 这 种 算法 ， 要 用 最 坏 情况 、 最 好 情况 和 普通 情况 来 描述 性 能 。 最 坏 情况 指 的 是 某 一 个 数据 集 
会 让 算法 的 性 能 极 差 ; 另 一 个 数据 集 可 能 会 让 同一 个 算法 的 性 能 极 好 〈 最 好 情况 )。 大 部 分 情况 
下 ， 算 法 的 性 能 介 于 两 个 极端 之 间 ( 普通 情况 )。 计 算 机 科学 家 要 理解 这 些 区 别 ， 以 免 被 某 个 特 
例 误导 。 

在 学 习 算 法 的 路 上 , 常见 的 函数 会 反复 出 现 , 如 表 2-1 所 示 。 要 判断 哪 一 个 才 是 7(n) 的 决定 
性 部 分 ， 必 须 了 解 它们 在 n 变 大 时 彼此 有 多 大 差别 。 图 2-1 展示 了 表 2-1 中 的 各 个 函数 。 注 意 ， 
当 n 较 小 时 ， 这 些 函 数 之 间 的 界限 不 是 很 明确 ， 很 难看 出 哪个 起 主导 作用 。 随 着 的 增长 ， 它 们 
之 间 的 差别 就 很 明显 了 。 









































































































































表 2-1 常见 的 大 O 函数 





fn) 名 称 
1 常数 
logn 对 数 
n 线性 
nlogn 对 数 线性 
平方 
立方 
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图 2-1 常见 的 大 O 函数 





最 后 来 看 一 个 例子 , 假设 有 如 代码 清单 2-5 所 示 的 一 段 Python 代码 。 尽 管 这 个 程序 没有 做 什 
么 实际 工作 ， 但 它 对 分 析 性 能 有 一 定 的 指导 意义 。 


代码 清单 2-5 Python 代码 示例 












































站 5 二 ' 光 

B= 6 

3 &: = "0 

4 for i In range(n): 

5 for j in range(n): 

6 > 和 

7 y=j*j 

8 BN 

9 for k in range(n): 

10 w= a* k+ 45 

让 8 

12.. "6.. 33 
赋值 操作 的 数量 是 4 项 之 和 : 7(n) = 3+3m +2n+1。 第 1 项 是 常数 3 ， 对 应 起 始 部 分 的 3 条 











赋值 语句 。 第 2 项 是 3n* ， 因 为 有 3 条 语句 要 在 巾 套 循环 中 重复 nn 次。 第 3 项 是 2n ， 因 为 两 条 语 
句 要 循环 n 遍 。 第 4 项 是 常数 1， 代 表 最 后 那 条 赋值 语句 。 








很 容易 看 出 来 ， 








T(n)=3+3n +2n+1=3n +2n+4 
起 主导 作用 ， 所 以 这 段 代 码 的 时 间 复 杂 度 是 O(n?) 。 当 nn 变 大 时 ， 其 他 项 























以 及 主导 项 的 系数 都 可 以 忽略 。 
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TY 


并 





2-2 展示 了 一 部 分 常见 的 大 O 函数 与 前 面 讨论 的 T(n) 函数 的 对 比 情 况 。 沪 
台 比 立方 函数 大 。 然 而 ， 随 着 的 增长 ， 立 方 函数 很 快 就 超越 了 7T(o) 。 


700 


，7(D) 一 开 
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图 2-2 对 比 T(n) 函数 与 常见 的 大 O 函数 


2.2.2” 异 序 词 检 测 示 例 


要 展示 不 同 数量 级 的 算法 ， 一 个 好 例子 就 是 经 典 的 异 序 词 检 测 问题 。 如 果 一 个 字符 串 只 是 重 
排 了 另 一 个 字符 串 的 字符 , 那么 这 个 字符 串 就 是 另 一 个 的 异 序 词 ， 比如 heart 与 earth, 以 及 python 
与 typhon。 为 了 简化 问题 ,假设 要 检查 的 两 个 字符 串 长 度 相同 , 并 且 都 是 由 26 个 英文 字母 的 小 写 
形式 组 成 的 。 我 们 的 目标 是 编写 一 个 布尔 函数 ,， 它 接受 两 个 字符 串 , 并 能 判断 它们 是 否 为 异 序 词 。 

1. 方 案 1: 清点 法 
清点 第 1 个 字符 串 的 每 个 字符 ,看 看 它们 是 否 都 出 现在 第 2 个 字符 串 中 。 如 果 是 ,那么 两 个 
字符 串 必然 是 异 序 词 。 清 点 是 通过 用 Python 中 的 特殊 值 None 取代 字符 来 实现 的 。 但 是 ， 因 为 
Python 中 的 字符 串 是 不 可 修改 的 ， 所 以 先 要 将 第 2 个 字符 串 转 换 成 列表 。 在 字符 列表 中 检查 第 1 
个 字符 串 中 的 每 个 字符 ， 如 果 找 到 了 ， 就 蔡 换 掉 。 代 码 清单 2-6 给 出 了 这 个 函数 。 
代码 清单 2-6 ”实现 清点 方案 
J def anagramSolutionl(sl1l, s2): 


2 alist = list(s2) 
3 
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4 DOSL. 

5 stillOK = True 

6 

7 while posl < len(s1) and stillOKk: 

8 BOS2 = 0 

9 found = False 

10 while pos2 < len(alist) and not foundgd: 
J if sl[pos1] == alist[p6s2]: 
2 found = True 

13 else: 

下 和 pos2 = pos2 + 1 

1 

16 if found: 

17 alist[pos2] = None 

18 else: 

于 9 stillOK = False 

20 

2 posl = posl + 1 

2 

23 return stillOK 





来 分 析 这 个 算法 。 注 意 ， 对 于 sl 中 的 n 个 字符 ,检查 每 一 个 时 都 要 遍历 s2 中 的 个 字符 。 
要 匹配 sl 中 的 一 个 字符 ， 列 表 中 的 n 个 位 置 都 要 被 访问 一 次 。 因 此 ， 访问 次 数 就 成 了 从 1 到 
的 整数 之 和 。 这 可 以 用 以 下 公式 来 表示 。 




















py n(nt+l) _ 1 2 
多 2 


1=1 


1 
aA 
2 





当 n 变 大 时 , 起 决定 性 作用 的 是 ， 而 可 以 忽略 。 所 以 , 这 个 方案 的 时 间 复 杂 度 是 O(n”) 。 


2. 方案 2: 排序 法 

尽管 sl 与 s2 是 不 同 的 字符 串 , 但 只 要 由 相同 的 字符 构成 ， 它 们 就 是 异 序 词 。 基 于 这 一 点 ， 
可 以 采用 男 一 个 方案 。 如 果 按 照 字母 表 顺 序 给 字符 排序 ， 异 序 词 得 到 的 结果 将 是 同一 个 字符 串 。 
代码 清单 2-7 给 出 了 这 个 方案 的 实现 代码 。 在 Python 中 , 可 以 先 将 字符 串 转 换 为 列表 ,然后 使 用 
内 建 的 sort 方法 对 列表 排序 。 


代码 清单 2-7 实现 排序 方案 









































1 def anagramSolution2(sl, s2): 
2 alist1 = list(s1) 

3 alist2 = list(s2) 

4 

5 alist1.sort() 

6 alist2.sort() 

+. 

8 DOS = 0 

9 matches = True 

10 
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kh while pos < len(s1) and matches: 
12 if alistl[pos] == alist2[pos]: 
13 pos = pos + 1 

14 else: 

5 matches = False 

16 

i return matches 























乍 看 之 下 ， 你 可 能 会 认为 这 个 算法 的 时 间 复 杂 度 是 O(n) ， 因 为 在 排序 之 后 只 需要 遍历 一 次 
就 可 以 比较 n 个 字符 。 但 是 ， 调 用 两 次 sort 方法 不 是 没有 代价 。 我 们 在 后 面 会 看 到 ， 排 序 的 时 
间 复 杂 度 基本 上 是 O(n ) 或 O(nlogn) ， 所 以 排序 操作 起 主导 作用 。 也 就 是 说 , 该 算法 和 排序 过 程 
的 数量 级 相同 。 

3. 方案 3: 蛮 力 法 

用 人 蛮 力 解决 问题 的 方法 基本 上 就 是 穷尽 所 有 的 可 能 。 就 异 序 词 检测 问题 而 言 ， 可 以 用 si 中 
的 字符 生成 所 有 可 能 的 字符 串 ， 看 看 s2 是 否 在 其 中 。 但 这 个 方法 有 个 难处 。 用 si 中 的 字符 生 
成 所 有 可 能 的 字符 串 时 , 第 1 个 字符 有 n 种 可 能 , 第 2 个 字符 有 7 -1 种 可 能 , 第 3 个 字符 有 zz -2 
种 可 能 ， 依 此 类 推 。 字 符 串 的 总 数 是 zx (nn 一] *(n 一 2)*…*3*2*] ， 即 n!。 也 许 有 些 字符 串 会 重 
复 , 但 程序 无 法 预见 ， 所 以 肯定 会 生成 nl! 个 字符 串 。 

当 n 较 大 时 ，n! 增 长 得 比 2” 还 要 快 。 实 际 上 ， 如 果 sl 有 20 个 字符 ， 那 么 字符 串 的 个 数 就 
是 20!=2 432 902 008 176 640 000 。 假设 每 秒 处 理 一 个 , 处 理 完整 个 列表 要 花 77 146 816 596 年 。 
这 可 不 是 个 好 方案 。 
4. 方案 4: 计数 法 
最 后 一 个 方案 基于 这 样 一 个 事实 : 两 个 异 序 词 有 同样 数目 的 a、 同 样 数目 的 b、 同 样 数目 
的 c， 等 等 。 要 判断 两 个 字符 串 是 否 为 异 序 词 ， 先 数 一 下 每 个 字符 出 现 的 次 数 。 因 为 字符 可 能 
26 种 ， 所 以 使 用 26 个 计数 器 ， 对 应 每 个 字符 。 每 遇 到 一 个 字符 ， 就 将 对 应 的 计数 器 加 1。 最 后 ， 
如 果 两 个 计数 器 列表 相同 ,那么 两 个 字符 串 肯定 是 异 序 词 。 代 码 清单 2-8 给 出 了 这 个 方案 的 实现 
代码 。 


代码 清单 2-8 ”实现 计数 方案 






































































































































1 def anagramSolution4(sl, s2): 

2 Gd sO E26 

3 C2 光 每 

4 

5 for i in range(len(s1)): 

6 pos = ord(s1l[i]) - ord('a') 
* llDOsl Se: ClBoBI :4 

8 

9 for i in range(len(s2)): 

10 DOS .S00rd(s2[i])' Sord("ar) 
i C2lpo8] .C21B08] 十 1 
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13 J 0 

14 stillOK = True 

15 while j < 26 and stillOK: 
16 TE LE ea] 

Hey j=j+1 

18 else: 

上 9 stillOK = False 
20 

21 return stillOK 





这 个 方案 也 有 循环 。 但 不 同 于 方案 1， 这 个 方案 的 循环 没有 髓 套 。 前 两 个 计数 循环 都 是 n 阶 
的 。 第 3 个 循环 比较 两 个 列表 ， 由 于 可 能 有 26 种 字符 ， 因 此 会 循环 26 次 。 全 部 加 起 来 ， 得 到 总 
步骤 数 T(n) = 22+26 ， 即 O(n) 。 我 们 找到 了 解决 异 序 词 检测 问题 的 线性 阶 算法 。 

结束 这 个 例子 的 讲解 之 前 ， 需 要 聊 聊 空间 需求 。 尽 管 方案 4 的 执行 时 间 是 线性 的 ， 它 还 是 要 
用 额外 的 空间 来 存储 计数 器 。 也 就 是 说 ， 这 个 算法 用 空间 换 来 了 时 间 。 

这 种 情形 很 常见 。 很 多 时 候 ， 都 需要 在 时 间 和 空间 之 间 进 行 权衡 。 本 例 中 ,额外 使 用 的 空间 
并 不 大 。 不 过 ， 如 果 有 数 以 百 万 计 的 字符 ， 那 就 有 问题 了 。 面 对 多 种 算法 和 具体 的 问题 ,计算 机 
科学 家 需要 决定 如 何 利用 好 计算 资源 。 
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你 对 大 O 记 法 及 其 不 同 函 数 的 差别 已 经 有 了 大 致 的 了 解 。 本 节 的 目标 是 针对 Python 的 列表 
和 字典 介绍 如 何 用 大 O 记 法 描述 操作 的 性 能 。 我 们 会 做 一 些 实验 ， 展 示 在 每 个 数据 结构 上 做 某 
些 操作 时 的 损耗 与 收益 。 理 解 这 些 Python 数据 结构 的 效率 很 重要 ， 因 为 它们 是 本 书 用 来 实现 其 
他 数据 结构 的 基石 。 本 节 不 会 解释 性 能 优 劣 的 原因 。 在 后 续 章节 中 ,你 会 看 到 列表 和 字典 的 一 些 
可 能 的 实现 ， 以 及 为 何 性 能 取决 于 实现 。 













































































2.3.1 列表 


在 实现 列表 数据 结构 时 ， Python 的 设计 师 有 许多 选择 ,每 一 个 选择 都 会 影响 操作 的 性 能 。 为 
了 做 出 正确 的 选择 , 他 们 考虑 了 列表 最 常见 的 用 法 ,并 据 此 优化 列表 的 实现 ， 以 使 最 常用 的 操作 
非常 快 。 当 然 ， 他 们 也 尽力 使 不 常用 的 操作 也 很 快 ， 但 在 需要 权衡 时 ， 往 往 会 牺牲 低频 操作 的 
性 能 。 

两 个 常见 操作 是 索引 和 给 某 个 位 置 赋值 。 无 论 列 表 多 长 ， 这 两 个 操作 所 花 的 时 间 应 该 恒定 。 
像 这 种 与 列表 长 度 无 关 的 操作 就 是 常数 阶 的 。 

男 一 个 常见 的 操作 是 加 长 列表 。 有 两 种 方式 : 要 么 采用 追加 方法 ,要么 执行 连接 操作 。 追 加 
方法 是 常数 阶 的。 如 果 待 连接 列表 的 长 度 为 k, 那么 连接 操作 的 时 间 复 杂 度 就 是 O(k) 。 知 道 这 一 
点 很 重要 ， 因 为 它 能 帮 你 选择 正确 的 工具 ， 使 程序 更 高 效 。 
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假设 要 从 0 开始 生成 含有 nn 个 数 的 列表 , 来 看 看 4 种 生成 方式 。 首 先 , 用 for 循环 通过 连接 
操作 创建 列表 ; 其 次 , 采用 追加 方法 ; 再 次 , 使 用 列表 解析 式 ; 最 后 ， 用 列表 构造 器 调用 range 
函数 (这 可 能 是 最 容易 想到 的 方式 )。 代 码 清单 2-9 给 出 了 4 种 方式 的 代码 。 假 设 代码 保存 在 文 
件 listfuns.py 中 。 


代码 清单 2-9 生成 列表 的 4 种 方式 






































1 def test11() : 

2 1 = [] 

3 for i in range(1000): 
4 | 

5 

6 def test2(): 

7 小 过:z 册 | 

8 for i in range(1000): 
9 1.append (i) 

10 

11 def test3(): 

下 六 1= [i for i in range(1000)] 
13 

14 def test4(): 

15 1 = list(range(1000)) 











要 得 到 每 个 函数 的 执行 时 间 , 需要 用 到 Python 的 timeit 模块 。 该 模块 使 Python 开发 人 员 能 
够 在 一 致 的 环境 下 运行 函数 , 并 且 在 多 种 操作 系统 下 使 用 尽 可 能 相似 的 机 制 , 以 实现 跨 平 台 计时 。 


要 使 用 timeit 模块 ， 首 先 创建 一 个 Timer 对 象 ， 其 参数 是 两 条 Python 语句 。 第 1 个 参数 
是 要 为 之 计时 的 Python 语句 ; 第 2 个 参数 是 建立 测试 的 语句 。t imeit 模块 会 统计 多 次 执行 语句 
要 用 多 久 。 默认 情况 下 ，timeit 会 执行 100 万 次 语句 ,并 在 完成 后 返回 一 个 浮 点 数 格式 的 秒 数 。 
不 过 ， 既 然 这 是 执行 100 万 次 所 用 的 秒 数 ， 就 可 以 把 结果 视 作 执 行 1 次 所 用 的 微 秒 数 。 此 外 ， 可 
以 给 timeit 传人 参数 number ,以 指定 语句 的 执行 次 数 。 下 面 的 例子 展示 了 测试 函数 各 运行 1000 
























































次 所 花 的 时 间 。 
tl = Timer("test1()", "from _ main _ import test1") 
print ("concat ", tl1.timeit (number=1000), "milliseconds") 
t2 = Timer("test2()", "from _ main _ import test2") 
print ("append ", t2.timeit (number=1000), "milliseconds") 
t3 = Timer("test3()", "from _ main _ import test3") 
print ("comprehension ", t3.timeit (number=1000), "milliseconds") 
t4 = Timer("test4()", "from _ main _ import test4") 
print ("list range ", t4.timeit (number=1000), "milliseconds") 


concat 6.54352807999 milliseconds 

append 0.306292057037 milliseconds 
comprehension 0.147661924362 milliseconds 
list range 0.0655000209808 milliseconds 
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在 本 例 中 ， 计 时 的 语句 是 对 test1() 、test2() 等 的 函数 调用 。 你 也 许 会 觉得 建立 测试 的 
语句 有 些 奇 怪 , 所 以 我 们 仔细 研究 一 下 。 你 可 能 已 经 熟悉 from 和 import , 但 它们 通常 在 Python 
程序 文件 的 开头 使 用 。 本 例 中 ，from main import test1 将 testl 因数 从 _main_ _ 
命名 空间 导 和 到 timeit 设置 计时 的 命名 空间 。timeit 模块 这 么 做 ， 是 为 了 在 一 个 干净 的 环境 
中 运行 计时 测试 ， 以 免 某 些 变量 以 某 种 意外 的 方式 干扰 函数 的 性 能 。 

实验 结果 清楚 地 表明 ,0.30 毫秒 的 追加 操作 远 快 于 6.54 毫 秘 的 连接 操作 。 实验 也 测试 了 5 两 “上 
种 列表 创建 操作 : 使 用 列表 解析 式 ， 以 及 使 用 列表 构造 器 调用 range。 有 趣 的 是 ， 与 用 for 循 
环 进行 追加 操作 相 比 ， 使 用 列表 解析 式 几 乎 快 一 倍 。 

关于 这 个 小 实验 要 说 明 的 最 后 一 点 是 , 执行 时 间 其 实 包 含 了 调用 测试 函数 的 额外 开销 , 但 可 
以 假设 4 种 情形 的 函数 调用 开销 相同 ， 所 以 对 比 操作 还 是 有 意义 的 。 鉴 于 此 ， 说 连接 操作 花 了 
6.54 毫秒 不 太 准 确 , 应 该 说 用 于 连接 操作 的 测试 函数 花 了 6.54 毫秒 。 可 以 做 个 练习 , 测 一 下 调用 
空 函 数 的 时 间 ， 然 后 从 之 前 得 到 的 数字 中 减 去 。 

知道 如 何 衡 量 性 能 之 后 ， 可 以 对 照 表 2-2， 看 看 基本 列表 操作 的 大 0 效率 。 仔 细 考 虑 之 后 ， 

你 可 能 会 对 pop 的 两 种 效率 有 疑问 。 在 列表 末尾 调用 pop 时 ， 操 作 是 常数 阶 的 ， 在 列表 头 一 个 

元 素 或 中 间 某 处 调用 pop 时 ， 则 是 n 阶 的 。 原 因 在 于 Python 对 列表 的 实现 方式 。 在 Python 中 ， 
从 列表 头 拿 走 一 个 元 素 ， 其 他 元 素 都 要 向 列表 头 挪 一 位 。 你 可 能 觉得 这 个 做 法 有 点 傻 , 但 再 看 看 
表 2-2, 你 会 明白 这 种 实现 保证 了 索引 操作 为 常数 阶 。Python 的 实现 者 认为 这 是 不 错 的 取舍 决策 。 
















































































表 2-2 ”Python 列表 操作 的 大 O 效率 























操作 大 0 效率 
索引 00) 
索引 赋值 00) 
追加 o0 
pop () OU) 
pop (i) O(n) 
insert (i, item) O(n) 

I 除 On) 
遍历 O(n) 
包含 O(n) 
切片 CU) 

| 除 切 片 O00) 
设置 切片 O(n+k) 
反 转 O(n) 
连接 O(K) 
排序 O(nlogn) 








乘法 On) 
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为 了 展示 pop () 和 pop (i) 的 性 能 差异 ， 我们 使 用 timeit 模块 做 男 一 个 实验 。 实 验 目 标 是 
针对 一 个 长 度 已 知 的 列表 , 分 别 从 列表 头 和 列表 尾 弹出 一 个 元 素 。 我 们 也 想 衡量 不 同 长 度 下 的 执 
行 时 间 。 预 期 结果 是 ， 从 列表 尾 弹 出 元 素 的 时 间 是 恒定 的 ， 而 从 列表 头 弹 出 元 素 的 时 间 会 随 着 列 
表 变 长 而 增加 。 

代码 清单 2-10 是 实验 代码 。 可 以 看 到 ， 从 列表 尾 弹 出 元 素 花 了 0.0003 毫秒 ， 从 列表 头 弹 出 
花 了 4.8214 毫秒 。 对 于 含有 200 万 个 元 素 的 列表 来 说 ， 后 者 是 前 者 的 16 000 倍 。 

有 两 点 需要 说 明 。 首 先是 from main _ import x 语 句 。 尽 管 没 有 定义 一 个 函数 ， 但 是 
我 们 仍然 希望 能 在 测试 中 使 用 列表 对 象 x。 这 个 办 法 允许 我 们 只 对 pop 语句 计时 , 从 而 准确 地 获 
得 这 一 个 操作 的 耗 时 。 其 次 ， 因 为 计时 重复 了 1000 次 ， 所 以 列表 每 次 循环 都 少 一 个 元 素 。 不 过 ， 
由 于 列表 的 初始 长 度 是 200 万 ， 因 此 对 于 整体 长 度 来 说 ， 只 减少 了 0.05%。 


代码 清单 2-10 pop 的 性 能 分 析 
















































































popzero = timeit.Timer ("x.pop(0)", 
"fTOM aa Tmort x") 
popend = timeit.Timer ("x.pop()" 
TO main: AmpDort ;") 


x = list(range(2000000)) 
popzero.timeit (number=1000) 
4.8213560581207275 


x = list(range(2000000)) 
popend.timeit (number=1000) 
0.0003161430358886719 


睛 上 上 上 Mo~ wm ww 
WOPO 














虽然 测试 结果 说 明 pop (0 ) 确实 比 pop () 慢 ,但 是 并 没有 证 明 pop (0) 的 时 间 复 杂 度 是 O(n) ， 
也 没有 证 明 pop () 的 是 O() 。 要 证 明 这 一 点 ， 需 要 看 看 两 个 操作 在 各 个 列表 长 度 下 的 性 能 。 代 
码 清 单 2-11 实现 了 这 个 测试 。 


代码 清单 2-11 比较 pop (0) 和 pop () 在 不 同 列表 长 度 下 的 性 能 








1 

多 popzero = Timer ("x.pop(0)", 

3 “from mali TmoOort x") 
4 popengd = Timer ("x.pop()", 

5 "from _ main _ import x") 
6 print ("pop(0) pop()") 

中 for i in range(1000000, 100000001, 1000000): 
8 x = list(range(i)) 

9 pt = popend.timeit (number=1000) 

10 x = ]ist.(Fangel(T)) 

TL pz = popzero.timeit (number=1000) 


12 print ("SLE5..5F; SES.5E" Sn (BZ DEY) 
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2-3 展示 了 实验 结果 。 可 以 看 出 ， 列 表 越 长 ，pop (0 ) 的 耗 时 也 随 之 变 长 ， 而 pop () 的 耗 
时 很 稳定 。 这 刚好 符合 O(n) 和 0() 的 特征 。 
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图 2-3 对比 pop (0) 和 pop() 的 性 能 

实验 会 有 一 些 误差 。 因 为 用 来 测量 的 计算 机 运行 着 其 他 进程 ， 所 以 可 能 拖 慢 代码 的 速度 。 
此 , 尽管 我 们 尽力 减少 计算 机 所 做 的 其 他 工作 , 测 出 的 时 间 仍 然 会 有 些许 变化 。 这 也 是 测试 1000 
遍 的 原因 ， 从 统计 角度 来 说 ， 收 集 足 够 多 的 信息 有 助 于 得 到 可 靠 的 结 




















2.3.2 字典 


Python 的 第 二 大 数据 结构 就 是 字典 。 你 可 能 还 记得 , 字典 不 同 于 列表 的 地 方 在 于 ,可 以 通过 
键 一 一 而 不 是 位 置 一 一 访问 元 素 。 你 会 在 后 文中 发 现 ， 实 现 字典 有 许多 方法 。 现 在 最 重要 的 是 ， 
知道 字典 的 取 值 操作 和 赋值 操作 都 是 常数 阶 。 另 一 个 重要 的 字典 操作 就 是 包含 (检查 某 个 键 是 否 
在 字典 中 )， 它 也 是 常数 阶 。 表 2-3 总 结 了 所 有 字典 操作 的 大 O 效率 。 要 注意 ， 表 中 给 出 的 效率 
针对 的 是 普通 情况 。 在 某 些 特殊 情况 下 ,包含 、 取 值 、 赋 值 等 操作 的 时 间 复 杂 度 可 能 变 成 Co) 。 
后 文 在 讨论 不 同 的 字典 实现 方式 时 会 详细 说 明 。 















































表 2-3 ”Python 字典 操作 的 大 O 效率 


























操作 大 0 效率 
复 第 On) 
取 值 OQ 
赋值 OQ 
出 除 OQ 
包含 00) 
遍历 O(n) 

















最 后 一 个 性 能 实验 会 比较 列表 和 字典 的 包含 操作 ， 并 验证 列表 的 包含 操作 是 O(n) ， 而 字典 
的 是 OO) 。 实 验 很 简单 ， 首 先 创建 一 个 包含 一 些 数 的 列表 ,然后 随机 取 一 些 数 ,看 看 它们 是 否 在 
列表 中 。 如 果 表 2-2 给 出 的 效率 是 正确 的 ,那么 随 着 列表 变 长 ， 判 断 一 个 数 是 否 在 列表 中 所 花 的 
时 间 也 就 越 长 。 

对 于 以 数字 为 键 的 字典 ,重复 上 述 实验 。 我 们 会 看 到 ， 判 断 数字 是 否 在 字典 中 的 操作 , 不仅 
快 得 多 ， 而 且 当 字典 变 大 时 ， 耗 时 基本 不 变 。 

代码 清单 2-12 实现 了 这 个 对 比 实验 。 注 意 ， 我 们 进行 的 是 完全 相同 的 操作 。 不 同 点 在 于 ， 
第 7 行 的 x 是 列表 , 第 9 行 的 x 则 是 字典 。 


代码 清单 2-12 ”比较 列表 和 字典 的 包含 操作 




































































J import timeit 

多 import random 

3 

4 for i in range(10000, 1000001, 20000): 

5 t = timeit.Timer ("random.randrange(%d) in x" % i, 
6 "from _ main _ import random, x") 
7 x = list(range(i)) 

8 lst_ time = t.timeit (number=1000) 

9 x = {j:None for j in range(i)} 

10 d_time = t.timeit (number=1000) 

下 于 print ("%d, $10.3f, %10.3f" % (i, lst_time, qd_time)) 




















图 2-4 展示 了 运行 结果 。 可 以 看 出 ,字典 一 直 更 快 。 对 于 元 素 最 少 的 情况 ( 10 000 ), 字典 的 
速度 是 列表 的 89.4 倍 。 对 于 元 素 最 多 的 情况 ( 990 000 ), 字典 的 速度 是 列表 的 11 603 倍 ! 还 可 以 
看 出 ， 随 着 规模 增加 ， 列 表 的 包含 操作 在 耗 时 上 的 增长 是 线性 的 ， 这 符合 O(n) 。 对 于 字典 来 说 ， 
即使 规模 增加 ， 包 含 操 作 的 耗 时 也 是 恒定 的 。 实 际 上 ， 当 字典 有 10 000 个 元 素 时 ， 包 含 操作 的 
耗 时 是 0.004 毫秒 ， 当 有 990 000 个 元 素 时 ， 耗 时 还 是 0.004 毫秒 。 
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执行 时 间 





0 
0 100000 200000 300 000 400000 500000 600000 700000 800 000 
长 度 
图 2-4 ”比较 列表 和 字典 的 包含 操作 


Python 是 一 门 变化 中 的 语言 ， 内 部 实现 一 直 会 有 更 新 。 可 以 在 官网 上 找到 Python 数据 结构 
性 能 的 最 新 信息 。 此 外 ， 可 以 参考 Python 的 时 间 复 杂 度 页 面 : http://wiki.python.org/moin/ 
TimeComplexity。 


1 000 000 














2.4 小 结 


口 算法 分 析 是 一 种 独立 于 实现 的 算法 度量 方法 。 
口 大 O 记 法 使 得 算法 可 以 根据 随 问题 规模 增长 而 起 主导 作用 的 部 分 进行 归 类 。 


2.5 关键 术语 








大 O 记 法 对 数 对 数 线性 
蛮 力 法 平方 普通 情况 
清点 法 时 间 复 杂 度 数量 级 

线性 旨 数 最 坏 情况 


A 
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2.6 讨论 题 
1. 给 出 以 下 代码 的 大 O 性 能 。 
for i in range(n): 
for j in range(n): 
k=2+2 
2. 给 出 以 下 代码 的 大 0 性 能 。 
for i in range(n): 
k=2+2 
3. 给 出 以 下 代码 的 大 0 性 能 。 
i 9 
三 
人 
4. 给 出 以 下 代码 的 大 0 性 能 。 
for i in range(n): 
for j in range(n): 
for k in range(n): 
k=2+2 
5.， 给 出 以 下 代码 的 大 0 性 能 。 
a 0 
k=2+2 
To 2 
6. 给 出 以 下 代码 的 大 0 性 能 。 
for i in range(n): 
k=2+2 
for j in range(n): 
k=2+2 
for k in range(n): 
民 - 芋 光 > 夺 ,2 
2.7 ”编程 练习 
1. 设计 一 个 实验 ,证明 列表 的 索引 操作 为 常数 阶 。 
2. 设计 一 个 实验 ， 证 明 字 上 典 的 取 值 操作 和 赋值 操作 为 常数 阶 。 
3. ”设计 一 个 实验 ， 针 对 列表 和 字典 比较 ael 操作 的 性 能 。 
4. ”给 定 一 个 数字 列表 ， 其 中 的 数字 随机 排列 ， 编 写 一 个 线性 阶 算法 ， 找 出 第 小 的 元 素 ， 
并 解释 为 何 该 算法 的 阶 是 线性 的 。 
5. 针对 前 一 个 练习 ， 能 将 算法 的 时 间 复 杂 度 优化 到 O(nlogn) 吗 ? 


基本 数据 结构 








3.1 本 章 目标 


口 理解 栈 、 队 列 、 双 端 队列 、 列 表 等 抽象 数据 类 型 。 

口 能 够 使 用 Python 列表 实现 栈 、 队 列 和 双 端 队列 。 

口 理解 基础 线性 数据 结构 的 性 能 。 

口 理解 前 序 、 中 序 和 后 序 表达 式 。 

口 使 用 栈 来 计算 后 序 表达 式 。 

口 使 用 栈 将 中 序 表 达 式 转换 成 后 序 表达 式 。 

口 使 用 队列 进行 基本 的 时 序 模拟 。 

口 理解 栈 、 队 列 以 及 双 端 队列 适用 于 解决 何 种 问题 。 

口 能 够 使 用 “节点 与 引用 ”模式 将 列表 实现 为 链表 。 

口 能 够 从 性 能 方面 比较 自己 的 链表 实现 与 Python 的 列表 实现 。 


3.2 何谓 线性 数据 结构 


























我 们 首先 学 习 4 种 简单 而 强大 的 数据 结构 。 栈 、 队 列 、 双 端 队 列 和 列表 都 是 有 序 的 数据 集合 ， 


其 元 素 的 顺序 取决 于 添加 顺序 或 移 除 顺序 。 一 旦 某 个 元 素 被 添加 进来 ， 它 与 前 后 元 素 的 相对 位 置 


将 保持 不 变 。 这 样 的 数据 集合 经 常 被 称 为 线性 数据 结构 。 





线性 数据 结构 可 以 看 作 有 两 庙 。 这 两 端 有 时 候 被 称 作 “ 左 端 ” 和 “ 右 端 "， 有 时 候 也 被 称 作 


“前 端 ” 和 “后 端 "。 当 然 ， 它 们 还 可 以 被 称 作 “ 顶 端 ” 和 “ 底 端 "。 名 字 本 身 并 不 重要 ， 




















真正 区 


分 线性 数据 结构 的 是 元 素 的 添加 方式 和 移 除 方式 , 尤其 是 添加 操作 和 移 除 操作 发 生 的 位 置 。 举 例 





来 说 ， 某 个 数据 结构 可 能 只 人 允许 在 一 端 添加 新 元 素 ， 有 些 则 允许 从 任意 一 端 移 除 元 素 。 


上 述 不 同 催生 了 计算 机 科学 中 最 有 用 的 一 些 数据 结构 。 它们 出 现在 众多 的 算法 中 , 并 且 可 用 


于 解决 许多 重要 的 问题 。 
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3.3 栈 





3.3.1 何谓 栈 


栈 有 时 也 被 称 作 “下 推 栈 "。 它 是 有 序 集合 ， 添 加 操作 和 移 除 操作 总 发 生 在 同一 端 ， 即 “项 
端 "， 男 一 端 则 被 称 为 “ 底 端 ”。 

栈 中 的 元 素 离 底 端 越 近 , 代表 其 在 栈 中 的 时 间 越 长 ,因此 栈 的 底 端 具 有 非常 重要 的 意义 。 最 
新 添加 的 元 素 将 被 最 先 移 除 。 这 种 排序 原则 被 称 作 LIFO ( last-in first-out )， 即 后 进 先 出 。 它 提供 
了 一 种 基于 在 集合 中 的 时 间 来 排序 的 方式 。 最 近 添 加 的 元 素 靠近 顶端 ， 旧 元 素 则 靠近 底 端 。 


栈 的 例子 在 日 常生 活 中 比比 皆 是 。 几 乎 所 有 咖啡 馆 都 有 一 个 由 托盘 或 盘子 构成 的 栈 , 你 可 以 
从 顶部 取 走 一 个 ， 下 一 个 顾客 则 会 取 走 下 面 的 托盘 或 盘子 。 图 3-1 是 由 书 构成 的 栈 ， 唯 一 露出 封 
面 的 书 就 是 顶部 的 那 本 。 为 了 拿 到 其 他 某 本 书 , 需要 移 除 压 在 其 上 面 的 书 。 图 3-2 展示 了 男 一 个 
栈 ， 它 包含 一 些 原 后 的 Python 数据 对 象 。 












































一 一 一 底 端 


图 3-2 由 原生 的 Python 数据 对 象 构成 的 栈 
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观察 元 素 的 添加 顺序 和 移 除 顺序 ,就 能 理解 栈 的 重要 思想 。 假设 桌 面 一 开始 是 空 的 , 每 次 只 





往 桌 上 放 一 本 书 。 如 此 堆 释 ， 便 能 构建 出 一 个 栈 。 取 书 的 顺序 正好 与 放 书 的 顺序 相反 。 由 于 可 用 














于 反 转 元 素 的 排列 顺序 ， 因 此 栈 十 分 重要 。 元 素 的 搬入 顺序 正好 与 移 除 顺序 相反 。 图 3-3 展示 了 





Python 数据 对 象 栈 的 创建 过 程 和 拆除 过 程 。 请 仔细 观察 数据 对 象 的 顺序 。 


最 后 ES 
区 
8.4 True "dog" 4 一 最 先 i 最 后 一 4 "dog" True 





原 顺 序 反 转 后 的 顺序 
图 3-3” 栈 的 反 转 特性 


考虑 到 栈 的 反 转 特性 , 我 们 可 以 想到 在 使 用 计算 机 时 的 一 些 例 子 。 例如， 








返回 按钮 。 当 我 们 从 一 个 网 页 跳 转 到 男 一 个 网 页 时 ， 这 些 网 页 一 一 实际 上 是 URL 


8.4 


每 一 个 浏览 需 都 有 
都 被 存放 








在 一 个 栈 中 。 当 前 正在 浏览 的 网 页 位 于 栈 的 顶端 ， 最 早 浏览 的 网 页 则 位 于 底 端 。 如 果 点 击 返 回 按 


钮 ， 便 开始 反 向 浏览 这 些 网 页 。 


3.3.2 ” 栈 抽象 数据 类 型 

















除 操 作 都 发 生 在 其 顶端 。 栈 的 操作 顺序 是 LIFO， 它 支持 以 下 操作 。 
口 stack () 创建 一 个 空 栈 。 它 不 需要 参数 ， 且 会 返回 一 个 空 栈 。 


口 bop () 将 栈 顶 端的 元 素 移 除 。 它 不 需要 参数 ， 但 会 返回 顶端 的 元 素 ， 并 | 























口 isEmpty () 检查 栈 是 否 为 空 。 它 不 需要 参数 ， 且 会 返回 一 个 布尔 值 。 
D size() 返 回 栈 中 元 素 的 数目 。 它 不 需要 参数 ， 且 会 返回 一 个 整数 。 

假设 s 是 一 个 新 创建 的 空 栈 。 表 3-1 展示 了 对 s 进行 一 系列 操作 的 结果 。 
中 ， 栈 项 端的 元 素 位 于 最 右 侧 。 














栈 抽象 数据 类 型 由 下 面 的 结构 和 操作 定义 。 如 前 所 述 ,， 栈 是 元 素 的 有 序 集 合 ， 添 加 操作 与 移 


口 push (item) 将 一 个 元 素 添 加 到 栈 的 顶端 。 它 需要 一 个 参数 item， 且 无 返回 值 。 





日 修改 栈 的 内 容 。 


口 peek () 返回 栈 项 端的 元 素 ， 但 是 并 不 移 除 该 元 素 。 它 不 需要 参数 ， 也 不 会 修改 栈 的 内 容 。 


在 “ 栈 内 容 ” 一 列 
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本 数据 结构 





表 3-1 栈 操 作 示 例 





栈 操 作 栈 内 容 返 回 值 
s.isEmpty () ] True 
s.push(4) 4] 
s.push('dog') 1 OO 
s.peek() 二 GO dog 
s.push (True) 4, 'dog', True] 
s.size() 4, 'dog', True] 3 
s.isEmpty () 4, 'dog', True] False 
s.push(8.4) 4, 'dog', True, 8.4] 

SBDt} 4, 'dog', True] 名 , 寺 
S.pop() a doo" True 
s.size() 4 dowd" 








3.3.3 用 Python 实现 栈 

明确 定义 栈 抽象 数据 类 型 之 后 ， 我 们 开始 用 Python 来 将 其 实现 。 如 前 文 所 述 ， 抽 象 数据 类 
型 的 实现 常 被 称 为 数据 结构 。 

正如 第 1 章 所 述 ， 和 其 他 面向 对 象 编 程 语 言 一 样 ， 每 当 需 要 在 Python 中 实现 像 栈 这 样 的 抽 
象 数 据 类 型 时 , 就 可 以 创建 新 类 。 栈 的 操作 通过 方法 实现 。 更 进一步 地 说 , 因为 栈 是 元 素 的 集合 ， 
所 以 完全 可 以 利用 Python 提供 的 强大 、 简 单 的 原生 集合 来 实现 。 这 里 ， 我 们 将 使 用 列表 。 

Python 列表 是 有 序 集合 ， 它 提供 了 一 整套 方法 。 举 例 来 说 ， 对 于 列表 [2, 5, 3,， 6, 7, 4]， 
只 需要 考虑 将 它 的 哪 一 边 视 为 栈 的 顶端 。 一 旦 确定 了 顶端 ， 所 有 的 操作 就 可 以 利用 appendq 和 
pop 等 列表 方法 来 实现 。 

代码 清单 3-1 是 栈 的 实现 , 它 假设 列表 的 尾部 是 栈 的 顶端 。 当 栈 增长 时 ( 即 进行 push 操作 )， 
新 的 元 素 会 被 添加 到 列表 的 尾部 。pop 操作 同样 会 修改 这 一 端 。 
代码 清单 3-1 用 Python 实现 栈 


































































































1 class Stack: 

2 def _ init _(self): 

3 self.items = [] 

4 

5 def isEmpty (self): 

6 return self.items == [] 
7 

8 def push(self, item): 

9 self.items.append (item) 
10 

二 def pop(self): 

于 久 return self.items.pop() 


3.3 栈 61 





14 def peek (self): 

15 return self.items[len(self.items)-1] 
16 

二 def size(self): 

18 return lenl(self.items) 





以 下 展示 了 表 3-1 中 的 栈 操作 及 其 返回 结果 。 


>>> s = Stack() 
>>> s.isEmpty () 
True 
>>> s.push(4) 

>>> s.push('dog') 
>>> S.Peek() 
'dog' 
>>> s.push (True) 








>>> s.size() 


>>> s.isEmpty () 


>>> s.push(8.4) 
>>> s.pop() 


>>> s.pop() 


>>> s.size() 





值得 注意 的 是 ,也 可 以 选择 将 列表 的 头 部 作为 栈 的 顶端 。 不 过 在 这 种 情况 下 ， 便 无 法 直接 使 
用 pop 方法 和 appeng 方法 , 而 必须 要 用 pop 方法 和 insert 方法 显 式 地 访问 下 标 为 0 的 元 素 ， 
即 列表 中 的 第 1 个 元 素 。 代 码 清单 3-2 展示 了 这 种 实现 。 


代码 清单 3-2” 栈 的 另 一 种 实现 











J class Stack: 

2 def _ init _(self): 

3 self.items = [] 

4 

5 def isEmpty (self): 

6 return self.items == [] 
7 

8 def push(self, item): 

9 self.items.insert (0, item) 
10 

1 def pop(self): 

12 return self.items.pop(0) 
13 

14 def peek (self): 

15 return self.items[0] 

16 

Ly def size(self): 

18 return len(self.items) 
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改变 抽象 数据 类 型 的 实现 却 保 留 其 逻辑 特征 ,这 种 能 力 体现 了 抽象 思想 。 不过, 尽管 上 述 两 
种 实现 都 可 行 , 但 是 二 者 在 性 能 方面 肯定 有 差异 。appeng 方法 和 pop () 方 法 的 时 间 复 杂 度 都 是 
0() , 这 意味 着 不 论 栈 中 有 多 少 个 元 素 , 第 一 种 实现 中 的 push 操作 和 pop 操作 都 会 在 恒定 的 时 
间 内 完成 。 第 二 种 实现 的 性 能 则 受制 于 栈 中 的 元 素 个 数 , 这 是 因为 insert (0) 和 pop(0) 的 时 间 
复杂 度 都 是 O(n) ， 元 素 越 多 就 越 慢 。 显 而 易 见 ， 尽 管 两 种 实现 在 逻辑 上 是 相等 的 ， 但 是 它们 在 
进行 基准 测试 时 耗费 的 时 间 会 有 很 大 的 差异 。 



































3.3.4 ”匹配 括号 
接 下 来 ,我 们 使 用 栈 解决 实际 的 计算 机 科学 问题 。 我 们 都 写 过 如 下 所 示 的 算术 表达 式 。 


(5+6)x*x (7+8)/ (4+3) 


其 中 的 括号 用 来 改变 计算 顺序 。 像 Lisp 这 样 的 编程 语言 有 如 下 语法 结构 。 


(defun square(n) 
(* n n)) 




















它 定义 了 一 个 名 为 square 的 函数 , 该 函数 会 返回 参数 n 的 平方 值 。Lisp 所 用 括号 之 多 , 令 
人 咋舌 。 
在 以 上 两 个 例子 中 , 括号 都 前 后 匹配 。 匹 配 括号 是 指 每 一 个 左 括号 都 有 与 之 对 应 的 一 个 右 括 
号 ， 并 且 括 号 对 有 正确 的 藤 套 关系 。 下 面 是 正确 匹配 的 括号 串 。 
(0 0 0 0) 
































EEC 人 3 








能 够 分 辨 括号 匹配 得 正确 与 否 ， 对 于 识别 编程 语言 的 结构 来 说 非常 重要 。 

我 们 的 挑战 就 是 编写 一 个 算法 , 它 从 左 到 右 读 取 一 个 括号 串 , 然后 判断 其 中 的 括号 是 否 匹 配 。 
为 了 解决 这 个 问题 , 需要 注意 到 一 个 重要 现象 。 当 从 左 到 右 处 理 括号 时 ,最 右边 的 无 匹配 左 括号 
必须 与 接 下 来 遇 到 的 第 一 个 右 括 号 相 匹配 ， 如 图 3-4 所 示 。 并 且 ， 在 第 一 个 位 置 的 左 括号 可 能 要 
等 到 处 理 至 最 后 一 个 位 置 的 右 括号 时 才能 完成 匹配 。 相 匹配 的 右 括号 与 左 括号 出 现 的 顺序 相反 。 
这 一 规律 暗示 着 能 够 运用 栈 来 解决 括号 匹配 问题 。 



























































相互 匹配 








第 一 个 左 括号 与 最 后 一 个 右 括号 匹配 
图 3-4 匹配 括号 


一 旦 认识 到 用 栈 来 保存 括号 是 合理 的 , 算法 编写 起 来 就 会 十 分 容易 。 由 一 个 空 栈 开 始 , 从 左 
往 右 依 次 处 理 括 号 。 如 果 遇 到 左 括号 ， 便 通过 push 操作 将 其 加 入 栈 中 ， 以 此 表示 稍 后 需要 有 一 
个 与 之 匹配 的 右 括号 。 反 之 ， 如 果 遇 到 右 括号 ， 就 调用 pop 操作 。 只 要 栈 中 的 所 有 左 括号 都 能 
遇 到 与 之 匹配 的 右 括号 , 那么 整个 括号 串 就 是 匹配 的 ; 如 果 栈 中 有 任何 一 个 左 括号 找 不 到 与 之 匹 
配 的 右 括 号 ， 则 括号 串 就 是 不 匹配 的 。 在 处 理 完 匹 配 的 括号 串 之 后 ， 栈 应 该 是 空 的 。 代 码 清单 
3-3 展示 了 实现 这 一 算法 的 Python 代码 。 


代码 清单 3-3 ”匹配 括号 
































from pythonds.basic import Stack 


1 
2 
3 def parChecker (symbolString): 
4 s = Stack() 
5 balanced = True 
6 index = 0 
7 while index < len(symbolString) and balanced: 
8 Symbol = symbolString[index] 
9 i Symbod Ee (Vs 
s.push (symbol) 
else: 
if s.isEmpty(): 
balanced = False 
else: 
s.pop() 


index = index + 1 


co OU 已 口 





19 if balanced andq s.isEmpty (): 
20 return True 

21 else: 

22 return False 








parChecker 函数 假设 Stack 类 可 用 ， 并 且 会 返回 一 个 布尔 值 来 表示 括号 串 是 否 匹 配 。 注 
意 ， 布 尔 型 变量 balanced 的 初始 值 是 True， 这 是 因为 一 开始 没有 任何 理由 假设 其 为 False。 
如 果 当 前 的 符号 是 左 括号 ， 它 就 会 被 压 入 栈 中 (第 9~10 行 ) 注意 第 15 行 ， 仅 通过 pop () 将 一 
个 元 素 从 栈 中 移 除 。 由 于 移 除 的 元 素 一 定 是 之 前 遇 到 的 左 括号 , 因此 并 没有 用 到 pop () 的 返回 值 。 
在 第 19~22 行 ， 只 要 所 有 括号 匹配 并 且 栈 为 空 ， 函 数 就 会 返回 True， 和 否则 返回 False。 
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3.3.5 ”普通 情况 : 匹配 符号 














符号 匹配 是 许多 编程 语言 中 的 常见 问题 , 括号 匹配 问题 只 是 一 个 特例 。 匹 配 符号 是 指正 确 地 
匹配 和 艇 套 左右 对 应 的 符号 。 例 如 , 在 Python 中 , 方 括号 [和 ] 用 于 列表 ; 花 括号 {和 } 用 于 字典 ; 
括号 (和 ) 用 于 元 组 和 算术 表达 式 。 只 要 保证 左右 符号 匹配 ,就 可 以 混用 这 些 符 号 。 以 下 符号 串 是 
匹配 的 ， 其 中 不 仅 每 一 个 左 符号 都 有 一 个 右 符 号 与 之 对 应 ， 而 且 两 个 符号 的 类 型 也 是 一 致 的 。 








{{([][])}()} 


























以 下 符号 串 则 是 不 匹配 的 。 
(0)] 








要 处 理 新 类 型 的 符号 ， 可 以 轻松 扩展 3.3.4 节 中 的 括号 匹配 检测 需 。 每 一 个 左 符号 都 将 被 压 
入 栈 中 ， 以 待 之 后 出 现 对 应 的 右 符号 。 唯 一 的 区 别 在 于 ， 当 出 现 右 符号 时 ,必须 检测 其 类 型 是 否 
与 栈 顶 的 左 符号 类 型 相 匹 配 。 如 果 两 个 符号 不 匹配 ,那么 整个 符号 串 也 就 不 匹配 。 同 样 ， 如 果 整 
个 符号 串 处 理 完成 并 且 栈 是 空 的 ， 那 么 就 说 明 所 有 符号 正确 匹配 。 




















代码 清单 3-4 展示 了 实现 上 述 算法 的 Python 程序 。 








的 改动 在 第 17 行 ,我 们 调用 了 一 个 





辅助 函数 来 匹配 符号 。 必 须 检测 每 一 个 从 栈 顶 移 除 的 符号 是 否 与 当前 的 右 符 号 相 匹配 。 如 果 不 匹 





配 ， 布 尔 型 变量 palanced 就 被 设 成 False。 


代码 清单 3-4 ”匹配 符号 





由 from Pythondqs .basic import Stack 

2 def parChecker (symbolString): 

3 Ss. ="Stackt() 

4 

5 balanced = True 

6 index = 0 

7 

8 while index < len(symbolString) and balanced 

六 Symbol = symbolString[index] 
if Symbol in "([{": 

s.push(symbol) 

else: 


if s.isEmpty(): 
balanced = False 
else: 
top = s.pop() 
if not matches (top, symbol): 
balanced = False 


oo >~]OOD 必 wm 用 口 
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19 

20 index = index + 1 

2 

次 区 if balanced andq s.isEmpty(): 
3 return True 

24 else: 

25 return False 

26 

27 def matches (open, close): 

28 opens = "([{" 

29 closers = ")]}" 

30 

31 return opens.index(open) == closers.index(close) 





以 上 两 个 例子 说 明 , 在 处 理 编程 语言 的 语法 结构 时 , 栈 是 十 分 重要 的 数据 结构 。 几 乎 所 有 记 
法 都 有 某 种 需要 正确 匹配 向 套 的 符号 。 除 此 之 外 , 栈 在 计算 机 科学 中 还 有 其 他 一 些 重要 的 应 用 
场景 ， 让 我 们 继续 探索 。 


3.3.6 ”将 十 进 制 数 转换 成 二 进 制 数 

在 学 习 计算 机 科学 的 过 程 中 , 我 们 基本 上 都 接触 过 二 进 制 数 。 由 于 所 有 存储 在 计算 机 中 的 值 
都 是 由 0 和 1 组 成 的 字符 串 ,， 因 此 二 进 制 在 计算 机 科学 中 非常 重要 。 如 果 不 能 在 二 进 制 表 达 方 式 
和 常见 表达 方式 之 间 转 换 ， 我 们 与 计算 机 的 交互 就 会 非常 麻烦 。 

整数 是 常见 的 数据 项 ,它们 在 计算 机 程序 中 无 处 不 在 。 我 们 在 数学 课 上 学 习 过 整数 ， 并 且 会 
用 十 进 制 或 者 以 10 为 基 来 表示 它们 。 十 进 制 数 23310 及 其 对 应 的 二 进 制 数 11101001; 可 以 分 别 按 
下 面 的 形式 表示 。 

2x10* +3x10' +3x10° 



























































lx2 .41x2:F1x2 40x2 41X2 40x2 0X2 lx 

如 何 才能 简便 地 将 整数 值 转换 成 二 进 制 数 呢 ?” 答 案 是 利用 一 种 叫 作 “ 除 以 2” 的 算法 ,该 算 
法 使 用 栈 来 保存 二 进 制 结果 的 每 一 位 。 

“ 除 以 2” 算 法 假设 待 处 理 的 整数 大 于 0。 它 用 一 个 简单 的 循环 不 停 地 将 十 进 制 数 除 以 2， 并 
且 记 录 余 数 。 第 一 次 除 以 2 的 结果 能 够 用 于 区 分 偶数 和 奇数 。 如 果 是 偶数 ， 则 余数 为 0， 因此 个 
位 上 的 数字 为 0; 如 果 是 奇数 ， 则 余数 为 1， 因 此 个 位 上 的 数字 为 1。 可 以 将 要 构建 的 二 进 制 数 
看 成 一 系列 数字 ; 计算 出 的 第 一 个 余数 是 最 后 一 位 。 如 图 3-5 所 示 ， 这 又 一 次 体现 了 反 转 特性 ， 
因此 用 栈 来 解决 该 问题 是 合理 的 。 


















































66 第 3 章 基本 数据 结构 





233 /2=116 rem=1 
116//2=58 rem=0 








se 
人 和 党 去 
58/2=29 rem=0 储 湾 
~ < 于 
29//2=14 rem=1 内 KS 
BS 十 深 
14/2=7 rem=0 ,2 小 
NE 泣 
7//2=3 rem=1 
3//2=1 rem=1 
A 
1/2=0 rem=1 
图 3-5 ”将 十 进 制 数 转换 成 二 进 制 数 





代码 清单 3-5 展示 了 “ 除 以 2” 算 法 的 Python 实现 。gdivideBy2 函数 接受 一 个 十 进 制 数 作为 
参数 , 然后 不 停 地 将 其 除 以 2。 第 6 行使 用 了 内 建 的 取 余 运算 符 s, 第 7 行将 求 得 的 余数 压 入 栈 中 。 
当 除 法 过 程 遇 到 0 之后， 第 10~12 行 就 会 构建 一 个 二 进 制 数字 串 。 第 10 行 创建 一 个 空 串 。 随 后 ， 
二 进 制 数字 从 栈 中 被 逐个 取出 ， 并 添加 到 数字 串 的 最 右边 。 最 后 ， 函 数 返 回 该 二 进 制 数字 串 。 


代码 清单 3-5 “ 除 以 2” 算法 的 Python 实现 




















工 from Pythondqs .basic import Stack 

2 def divideBy2 (decNumber): 

3 remstack = Stack() 

4 

5 while decNumber > 0: 

6 rem = decNumber % 2 

- remstack.push (rem) 

8 decNumber = decNumber // 2 
9 

10 OEStiingr a Yn 

六 于 while not remstack.isEmpty(): 
下 次 binString = binString + str(remstack.pop()) 
3 

14 return binSstring 





这 个 将 十 进 制 数 转 换 成 二 进 制 数 的 算法 很 容易 扩展 成 对 任何 进 制 的 转换 。 在 计算 机 科学 中 ， 
常常 使 用 不 同 编码 的 数字 ， 其 中 最 常见 的 是 二 进 制 、 八 进 制 和 十 六 进 制 。 











十 进 制 数 23310 对 应 的 八进制 数 351g 征 
3x8* +5x8! +1x8" 
15x16' +9x16" 


可 以 将 aivideBy2 函数 修改 成 接受 一 个 十 进 


0 十 六 进 制 数 E9 








6 可 以 分 别 按 下 面 的 形式 表示 。 


捉 数 以 及 希望 转换 的 进 制 基数 ,“ 除 以 2” 则 变 


成 “ 除 以 基数 ”。 在 代码 清单 3-6 中 ，lbaseConverter 函数 接受 一 个 十 进 制 数 和 一 个 2~16 的 基 
数 作为 参数 。 处 理 方 法 仍然 是 将 余数 压 人 栈 中 ， 直 到 被 处 理 的 值 为 0。 之 前 的 从 左 到 右 构 建 数字 
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串 的 方法 只 需要 修改 一 处 。 以 2~10 为 基数 时 ， 最 多 只 需要 10 个 数字 ， 因 此 0~9 这 10 个 整数 够 
用 。 当 基数 超过 10 时 ， 就 会 遇 到 问题 。 不 能 再 直接 使 用 余数 ， 这 是 因为 余数 本 身 就 是 两 位 的 十 
进 制 数 。 因 此 ， 需 要 创建 一 套数 字 来 表示 大 于 9 的 余数 。 

一 种 解决 方法 是 添加 一 些 字母 字符 到 数字 中 。 例 如 ， 十 六 进 制 使 用 10 个 数字 以 及 前 6 个 字 
母 来 代表 16 位 数字 。 在 代码 清单 3-6 中 ， 为 了 实现 这 一 方法 ， 第 3 行 创 建 了 一 个 数字 字符 串 来 
存储 对 应 位 置 上 的 数字 。0 在 位 置 0，! 在 位 置 1，A 在 位 置 10，B 在 位 置 11， 依 此 类 推 。 当 从 栈 
中 移 除 一 个 余数 时 ， 它 可 以 被 用 作 访 问 数字 的 下 标 ， 对 应 的 数字 会 被 添加 到 结果 中 。 如 果 从 栈 中 
移 除 的 余数 是 13 ， 那 么 字母 D 将 被 添加 到 结果 字符 串 的 最 后 。 


代码 清单 3-6 ”将 十 进 制 数 转换 成 任意 进 制 数 



























































1 from pythonds.basic import Stack 

2 def baseConverter (decNumber, base): 

3 digits = "0123456789ABCDEF" 

4 

5 remstack = Stack() 

6 

7 while decNumber > 0: 

8 rem = decNumber % base 

9 remstack.push (rem) 

10 decNumber = decNumber // base 
11 

12 newString = "" 

3 while not remstack.isEmpty(): 

Wd newString = newString + digits[remstack.pop()] 
15 

下 和 return newString 





3.3.7 ”前 序 、 中 序 和 后 序 表达 式 


对 于 像 B * c 这 样 的 算术 表达 式 ， 可 以 根据 其 形式 来 正确 地 运算 。 在 B * c 的 例子 中 ,由 
于 乘 号 * 出 现在 两 个 变量 之 间 ， 因 此 我 们 知道 应 该 用 变量 B 乘 以 变量 Cc。 因 为 运算 符 出 现在 两 个 
操作 数 的 放 条 ， 所 以 这 种 表达 式 被 称 作 中 序 表 达 式 。 

来 看 另 一 个 中 序 表达 式 的 例子 : A + B * C。 虽 然 运算 符 + 和 * 都 在 操作 数 之 间 ， 但 是 存在 
一 个 问题 : 它们 分 别 作用 于 哪些 操作 数 ? + 是否 作用 于 A 和 B? * 是 否 作用 于 B 和 c? 这 个 表达 式 
看 起 来 存在 歧义 。 

事实 上 , 我 们 经 常 读 写 这 类 表达 式 , 并 且 没有 遇 到 任何 问题 。 这 是 因为 ,我 们 知道 -和 * 的 特 
点 。 每 一 个 运算 符 都 有 一 个 优先 级 。 在 运算 时 ， 高 优先 级 的 运算 符 先 于 低 优先 级 的 运算 符 。 唯 一 
能 够 改变 运算 顺序 的 就 是 括号 。 乘 法 和 除法 的 优先 级 高 于 加 法 和 减法 。 如 果 两 个 运算 符 的 优先 级 
相同 ， 那 就 按照 从 左 到 右 或 者 结合 性 的 顺序 运算 。 

让 我 们 从 运算 符 优先 级 的 角度 来 理解 A + B * c。 首 先 计算 B * c， 然后 再 将 A 与 该 乘积 
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相 加 。(A + B) * C 则 是 先 计 算 A 与 B 之 和 ， 然 后 再 进行 乘法 运算 。 在 表达 式 A + B + CcC 中 ， 
根据 优先 级 法 则 (或 者 结合 性 )， 最 左边 的 + 会 首先 参与 运算 。 

尽管 这 些 规律 对 于 人 来 说 显而易见 , 计算 机 却 需 要 明确 地 知道 以 何 种 顺序 进行 何 种 运算 。 一 
种 杜绝 歧义 的 写法 是 完全 括号 表达 式 。 这 种 表达 式 对 每 一 个 运算 符 都 添加 一 对 括号 。 由 括号 决定 
运算 顺序 ， 没 有 任何 歧义 ， 并且 不 必 记 忆 任 何 优先 级 规则 。 

A+B*C+D 可 以 被 重 写成 ((A + (B * c)) + D)， 以 表明 乘法 优先 ， 然 后 计算 左边 
的 加 法 表达 式 。 由 于 加 法 运算 从 左 往 右 结合 ， 因此 和 A + B + C+D 可 以 被 重 写成 ((( 和 A + B) + 
(C0 ED 

还 有 男 外 两 种 重要 的 表达 式 ， 也 许 并 不 能 一 日 了 然 地 看 出 它们 的 含义 。 考 虑 中 序 表达 式 A + 
B。 如 果 把 运算 符 放 到 两 个 操作 数 之 前 ， 就 得 到 + A B。 同 理 ， 如 果 把 运算 符 移 到 最 后 ， 会 得 到 入 
B +。 这 两 种 表达 式 看 起 来 有 点 奇怪 。 

通过 改变 运算 符 与 操作 数 的 相对 位 置 ， 我 们 分 别 得 到 前 序 表达 式 和 后 序 表达 式 。 前 序 表达 
式 要 求 所 有 的 运算 符 出 现在 它 所 作用 的 两 个 操作 数 之 前 ， 后 序 表达 式 则 相反 。 表 3-2 列 出 了 一 些 
例子 。 
























































表 3-2 中 序 、 前 序 与 后 序 表达 式 





中 序 表达 式 前 序 表达 式 后 序 表达 式 
A+B +AB AB+ 
Rie BB +A*BC BC * 出 








A + B * C 可 以 被 重 写 为 前 序 表达 式 + A * B Cc。 乘 号 出 现在 B 和 c 之 前 ,代表 着 它 的 优 
先 级 高 于 加 号 。 加 号 出 现在 A 和 乘法 结果 之 前 。 


A + B * C 对 应 的 后 序 表 达 式 是 A B Cc * +。 运 算 顺序 仍然 得 以 正确 保留 ， 这 是 由 于 乘 号 
紧 跟 B 和 c 出 现 ， 意味 着 它 的 优先 级 比 加 号 更 高 。 尽 管 运 算 符 被 移 到 了 操作 数 的 前 面 或 者 后 面 ， 
但 是 运算 顺序 并 没有 改变 。 

现在 来 看 看 中 序 表 达 式 (A + B) * C。 插 号 用 来 保证 加 号 的 优先 级 高 于 乘 号 。 但 是 ， 当 A 
+ B 被 写成 前 序 表达 式 时 ， 只 需 将 加 号 移 到 操作 数 之 前 ， 即 + A B。 于 是 ， 加 法 结果 就 成 了 乘 
号 的 第 一 个 操作 数 。 乘 号 被 移 到 整个 表达 式 的 最 前 面 ， 从 而 得 到 * + A B c。 同 理 ， 后 序 表达 
式 A B + 保证 优先 计算 加 法 。 乘 法 则 在 得 到 加 法 结果 之 后 再 计算 。 因 此 ， 正 确 的 后 序 表达 式 为 
AB+C *o 

表 3-3 列 出 了 上 述 3 个 表达 式 。 请 注意 一 个 非常 重要 的 变化 。 在 后 两 个 表达 式 中 ， 括 号 去 哪 
里 了 ? 为 什么 前 序 表 达 式 和 后 序 表 达 式 不 需要 括号 ? 答案 是 , 这 两 种 表达 式 中 的 运算 符 所 对 应 的 
操作 数 是 明确 的 。 只 有 中 序 表 达 式 需要 额外 的 符号 来 消除 歧义 。 前 序 表达 式 和 后 序 表达 式 的 运算 
顺序 完全 由 运算 符 的 位 置 决定 。 鉴 于 此 ， 中 序 表 达 式 是 最 不 理想 的 算式 表达 法 。 














































































































表 3-3 括号 的 变化 
中 序 表达 式 前 序 表达 式 后 序 表达 式 
B 


(A+B)*C 起 A 








表 3-4 展示 了 更 多 的 中 序 表达 式 及 其 对 应 的 前 序 表达 式 和 后 序 表达 式 。 请 确保 自己 明白 对 应 
的 表达 式 为 何在 运算 顺序 上 是 等 价 的 。 


表 3-4 ”中 序 、 前 序 与 后 序 表达 式 示例 














中 序 表达 式 前 序 表达 式 后 序 表达 式 
BCA4 DD ++A*BCD RB DE 
(A+B)* (C+D) *+AB+CD RD 
A*B+C*D :A RB CD 
六 二 有 二 必 寺 六 + BB 站 


1. 从 中 序 向 前 序 和 后 序 转换 


到 目前 为 止 ， 我 们 使 用 了 特定 的 方法 来 将 中 序 表达 式 转换 成 对 应 的 前 序 表 达 式 和 后 序 表达 
式 。 正 如 你 所 想 ， 存 在 通用 的 算法 ， 可 用 于 正确 转换 任意 复杂 度 的 表达 式 。 


首先 使 用 完全 括号 表达 式 。 如 前 所 述 ， (B * C) ) ， 以 表示 乘 
号 的 优先 级 高 于 加 号 。 进 一 步 观察 后 会 发 现 , 每 一 对 括号 其 实 对 应 着 一 个 中 序 表达 式 ( 包含 两 个 
操作 数 以 及 其 间 的 运算 符 )。 

观察 子 表达 式 (B * C) 的 右 括号 。 如 果 将 乘 号 移 到 右 括号 所 在 的 位 置 ， 并且 去 掉 左 括号 ， 就 


会 得 到 B c *， 这 实际 上 是 将 该 子 表 达 式 转换 成 了 对 应 的 后 序 表达 式 。 如 果 把 加 号 也 移 到 对 应 的 
右 括 号 所 在 的 位 置 ， 并 且 去 掉 对 应 的 左 括号 ， 就 能 得 到 完整 的 后 序 表达 式 ， 如 网 3-6 所 示 。 
































图 3-6 ”向 右 移动 运算 符 ， 以 得 到 后 序 表达 式 


如 果 将 运算 符 移 到 左 括号 所 在 的 位 置 ,并且 去 掉 对 应 的 右 括号 , 就 能 得 到 前 序 表达 式 ， 如 图 
3-7 所 示 。 实 际 上 ， 括 号 对 的 位 置 就 是 其 包含 的 运算 符 的 最 终 位 置 。 


























图 3-7 向 左 移动 运算 符 ， 以 得 到 前 序 表达 式 





70 第 3 章 基本 数据 结构 

















因此 , 若 要 将 任意 复杂 的 中 序 表达 式 转换 成 前 序 表 达 式 或 后 序 表 达 式 ,可 以 先 将 其 写作 完全 
括号 表达 式 ， 然 后 将 括号 内 的 运算 符 移 到 左 括号 处 ( 前 序 表达 式 ) 或 者 右 括号 处 ( 后 序 表达 式 )。 

下 面 来 看 一 个 更 复杂 的 表达 式 : (A + B) *C- (D- EE)* (FE+G)。 图 3-8 展 示 了 将 
其 转换 成 前 序 表达 式 和 后 序 表达 式 的 过 程 。 


(A+B) *C- (D-E)* (F+G) 

















(( A+B)*C)- ((D-E)* (F+G))) 
前 序 表达 式 后 序 表达 式 
—-*+ABC*-DE+FG AB+C*DE-FG+*-— 








图 3-8 ”将 复杂 的 中 序 表达 式 转换 成 前 序 表达 式 和 后 序 表达 式 


2. 从 中 序 到 后 序 的 通用 转换 法 

我 们 需要 开发 一 种 将 任意 中 序 表 达 式 转换 成 后 序 表 达 式 的 算法 。 为 了 完成 这 个 目标 , 让 我 们 
进一步 观察 转换 过 程 。 
次 研究 A + B * C 这 个 例子 。 如 前 所 示 ， 其 对 应 的 后 序 表达 式 为 A B C * +。 操 作 数 
A、B 和 Cc 的 相对 位 置 保持 不 变 ， 只 有 运算 符 改 变 了 位 置 。 再 观察 中 序 表 达 式 中 的 运算 符 。 从 左 
往 右 看 ,第 一 个 出 现 的 运算 符 是 +。 但 是 在 后 序 表达 式 中 ， 由 于 * 的 优先 级 更 高 ， 因 此 * 先 于 + 出 
现 。 在 本 例 中 ， 中 序 表达 式 的 运算 符 顺 序 与 后 序 表 达 式 的 相反 。 

在 转换 过 程 中 ， 由 于 运算 符 右边 的 操作 数 还 未 出 现 ， 因 此 需要 将 运算 符 保 存在 某 处 。 同 时 ， 
于 运算 符 有 不 同 的 优先 级 , 因此 可 能 需要 反 转 它们 的 保存 顺序 。 本 例 中 的 加 号 与 乘 号 就 是 这 种 
情况 。 由 于 中 序 表 达 式 中 的 加 号 先 于 优先 级 更 高 的 乘 号 出 现 , 因此 后 序 表达 式 需 要 反 转 它们 的 出 
现 顺序 。 鉴 于 这 种 反 转 特性 ， 使 用 栈 来 保存 运算 符 就 显得 十 分 合理 。 

对 于 (A + B) * C， 情 况 会 如 何 呢 ? 它 对 应 的 后 序 表达 式 为 A B + C *。 从 左 往 右 看 ， 首 
先 出 现 的 运算 符 是 +。 不 过 ， 由 于 括号 改变 了 运算 符 的 优先 级 ， 因 此 当 处 理 到 * 时 ，+ 已 经 被 放 人 
结果 表达 式 中 了 。 现 在 可 以 来 总 结 转换 算法 : 当 遇 到 左 括号 时 ， 需 要 将 其 保存 ， 以 表示 接 下 来 会 
遇 到 高 优先 级 的 运算 符 ; 那个 运算 符 需要 等 到 对 应 的 右 括号 出 现 才 能 确定 其 位 置 ( 回忆 一 下 完全 
括号 表达 式 的 转换 法 )， 当 右 括号 出 现时 ， 便 可 以 将 运算 符 从 栈 中 取出 来 。 

在 从 左 往 右 扫描 中 序 表达 式 时 , 我们 利用 栈 来 保存 运算 符 。 这 样 做 可 以 提供 反 转 特性 。 栈 的 顶 
端 永远 是 最 新 添加 的 运算 符 。 每 当 遇 到 一 个 新 的 运算 符 时 ， 都 需要 对 比 它 与 栈 中 运算 符 的 优先 级 。 

假设 中 序 表达 式 是 一 个 以 空格 分 隔 的 标记 串 。 其 中 ， 运 算 符 标记 有 *、/ 、+ 和 -， 插 号 标记 
有 (和) ， 操 作 数 标记 有 A、B、c 等 。 下 面 的 步骤 会 生成 一 个 后 序 标记 串 。 
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(1) 创建 用 于 保存 运算 符 的 空 栈 opstack， 以 及 一 个 用 于 保存 结果 的 空 列表 。 
(2) 使 用 字符 串 方 法 split 将 输入 的 中 序 表达 式 转换 成 一 个 列表 。 
(3) 从 左 往 右 扫描 这 个 标记 列表 。 
口 如 果 标 记 是 操作 数 ， 将 其 添加 到 结果 列表 的 末尾 。 
口 如 果 标 记 是 左 括号 ， 将 其 压 人 opstack 栈 中 。 
口 如 果 标 记 是 右 括号 ， 反 复 从 opstack 栈 中 移 除 元 素 ， 直 到 移 除 对 应 的 左 括号 。 将 从 栈 中 
取出 的 每 一 个 运算 符 都 添加 到 结果 列表 的 末尾 。 
口 如 果 标 记 是 运算 符 ， 将 其 压 人 opstack 栈 中 。 但 是 ,在 这 之 前 ， 需 要 先 从 栈 中 取出 优先 
级 更 高 或 相同 的 运算 符 ， 并 将 它们 添加 到 结果 列表 的 末尾 。 

(4) 当 处 理 完 输入 表达 式 以 后 ， 检 查 opstack。 将 其 中 所 有 残留 的 运算 符 全 部 添加 到 结果 列 
表 的 末尾 。 

3-9 展示 了 利用 上 述 算法 转换 A * B + C * D 的 过 程 。 注 意 ， 第 一 个 * 在 处 理 至 + 时 被 移 
出 栈 。 由 于 乘 号 的 优先 级 高 于 加 号 ， 因 此 当 第 二 个 * 出 现时 ，+ 仍 然 留 在 栈 中 。 在 中 序 表 达 式 的 最 
后 ， 进 行 了 两 次 出 栈 操作 ， 用 于 移 除 两 个 运算 符 ， 并 将 + 放 在 后 序 表 达 式 的 末尾 。 


他 

































































AB*CD* 二 


图 3-9 将 中 序 表 达 式 A * B + C * D 转换 为 后 序 表达 式 RAB* CD*+ 


为 了 在 Python 中 实现 这 一 算法 ， 我 们 使 用 一 个 叫 作 prec 的 字典 来 保存 运算 符 的 优先 级 值 。 
该 字典 把 每 一 个 运算 符 都 映射 成 一 个 整数 。 通 过 比较 对 应 的 整数 ,可 以 确定 运算 符 的 优先 级 (本 
例 随意 地 使 用 了 3、2、1 )。 左 括号 的 优先 级 值 最 小 。 这 样 一 来 ， 任 何 与 左 括号 比较 的 运算 符 都 
会 被 压 人 栈 中 。 我 们 也 将 导入 string 模块 , 它 包 含 一 系列 预定 义 变量 。 本 例 使 用 一 个 包含 所 有 
大 写字 母 的 字符 串 ( string.ascii_uppercase ) 来 代表 所 有 可 能 出 现 的 操作 数 。 代 码 清单 3-7 
展示 了 完整 的 转换 函数 。 
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代码 清单 3-7 ”用 Python 实现 从 中 序 表达 式 到 后 序 表达 式 的 转换 














J from pythonds.basic import Stack 

多 import string 

3 

4 def infixToPostfix(infixexpr): 

SS prec = {} 

6 Tec = 3 

3 prec["/"] = 3 

8 |] 和 " 沟 

9 precl"="] 2 

10 prec["("] = 1 

站 

于 用 opStack = Stack() 

13 postfixList = [] 

14 

15 tokenList = infixexpr.split() 

16 

于 又 for token in tokenList: 

18 if token in string.ascii uppercase: 
19 postfixList.append (token) 

20 SliFf EORell = (0 

发 出 opStack.push (token) 

2 elif token == ')': 

23 topToken = opStack.pop() 

24 while topToken != '(': 

25 postfixList.append (topToken) 
26 topToken = opStack.pop() 

27 else: 

28 while (not opStack.isEmpty()) and \ 
29 (prec[opStack.peek()] >= prec[ltoken]): 
30 postfixList.append (opStack.pop()) 
1 opStack.push (token) 

32 

S33 while not opStack.isEmpty() : 

34 postfixList.append (opStack.pop()) 

35 

36 return " ".join(postfixList) 











以 下 是 一 些 例子 的 执行 结果 。 


>>> infixtopostfix("( A+B)* (C+D)") 
DD 

SS InfixtopGstfix(C™( Kt BB ) wR CO" 
'AB+C*!' 

>>> infixtopostfix("A + B * C") 

人 


3. 计算 后 序 表 达 式 

最 后 一 个 关于 栈 的 例子 是 计算 后 序 表达 式 。 在 这 个 例子 中 , 栈 再 一 次 成 为 适合 选择 的 数据 结 
构 。 不 过 ， 当 扫描 后 序 表达 式 时 ,需要 保存 操作 数 ， 而 不 是 运算 符 。 换 一 个 角度 来 说 ， 当 遇 到 一 
个 运算 符 时 ,需要 用 离 它 最 近 的 两 个 操作 数 来 计算 。 
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为 了 进一步 理解 该 算法 ， 考 虑 后 序 表达 式 4 5 6 * +。 当 从 左 往 右 扫描 该 表达 式 时 ， 首 先 
会 遇 到 操作 数 4 和 5。 在 遇 到 下 一 个 符号 之 前 ， 我 们 并 不 确定 要 对 它们 进行 什么 运算 。 将 它们 都 
保存 在 栈 中 ， 便 可 以 在 需要 时 取 用 。 

在 本 例 中 ， 紧 接着 出 现 的 符号 又 是 一 个 操作 数 。 因 此 , 将 6 也 压 人 栈 中 , 并 继续 检查 后 面 的 
符号 。 现 在 遇 到 运算 符 *， 这 意味 着 需要 将 最 近 遇 到 的 两 个 操作 数 相 乘 。 通 过 执行 两 次 出 栈 操 作 ， 
可 以 得 到 相应 的 操作 数 ， 然 后 进行 乘法 运算 〈 本 例 的 结果 是 30 )。 

接着 ,将 结果 压 人 栈 中 。 这 样 一 来 ， 当 遇 到 后 面 的 运算 符 时 ， 它 就 可 以 作为 操作 数 。 当 处 理 
完 最 后 一 个 运算 符 之 后 , 栈 中 只 剩 一 个 值 。 将 这 个 值 取出 来 ,并 作为 表达 式 的 结果 返回 。 图 3-10 
展示 了 栈 的 内 容 在 整个 计算 过 程 中 的 变化 。 












































从 左 向 右 处 理 一 一 一 











4 5 6 * + 
| | 
压 入 取出 两 个 操 
压 凡 。 全 作 数 并 计算 








图 3-10” 栈 的 内 容 在 整个 计算 过 程 中 的 变化 











图 3-11 展示 了 一 个 更 复杂 的 例子 : 7 8 + 3 2 + /。 有 两 处 需要 注意 。 首 先 ， 伴随 着 子 表 
达 式 的 计算 ， 栈 增 大 、 缩 小 ,然后 再 一 次 增 大 。 其 次 ， 处 理 除法 运算 时 需要 非常 小 心 。 由 于 后 序 
表达 式 只 改变 运算 符 的 位 置 , 因此 操作 数 的 位 置 与 在 中 序 表 达 式 中 的 位 置 相同 。 当 从 栈 中 取出 除 
号 的 操作 数 时 ， 它 们 的 顺序 颠倒 了 。 由 于 除 号 不 是 可 交换 的 运算 符 (15/5 和 5/15 的 结果 不 相 


同 )， 因 此 必须 保证 操作 数 的 顺序 没有 颠倒 。 
7 8 3 / 
可 


图 3-11 一 个 更 复杂 的 例子 
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假设 后 序 表 达 式 是 一 个 以 空格 分 隔 的 标记 串 。 其 中 ， 运 算 符 标记 有 * 、/、+ 和 -， 操 作 数 标 





记 是 一 位 的 整数 值 。 结 果 是 一 个 整数 。 


(1) 创建 空 栈 operandstack。 
(2) 使 用 字符 串 方法 split 将 输入 的 后 序 表达 式 转换 成 一 个 列表 。 
(3) 从 左 往 右 扫描 这 个 标记 列表 。 


口 如 果 标 记 是 操作 数 ， 将 其 转换 成 整数 并 且 压 人 operandstack 栈 中 。 
口 如 果 标 记 是 运算 符 ， 从 operanqstack 栈 中 取出 两 个 操作 数 。 第 一 次 取出 右 操作 数 ， 第 
二 次 取出 左 操作 数 。 进 行 相应 的 算术 运算 ， 然 后 将 运算 结果 压 人 operandstack 栈 中 。 


(4) 当 处 理 完 输 入 表达 式 时 ， 栈 中 的 值 就 是 结果 。 将 其 从 栈 中 返回 。 
代码 清单 3-8 是 计算 后 序 表 达 式 的 完整 函数 。 为 了 方便 运算 , 我 们 定义 了 辅助 函数 doMath。 
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它 接 受 一 个 运算 符 和 两 个 操作 数 ， 并 进行 相应 的 运算 。 
代码 清单 3-8 用 Python 实现 后 序 表达 式 的 计算 








|: 
2 
3 
4 
5 
6 
全 
8 
9 


OOODOPO 





‘Oo 


from pythonds.basic import Stack 
def postfixEval (postfixExpr): 
operandStack = Stack!() 


tokenList = postfixExpr.split() 


for token in tokenList: 

if token in "0123456789": 
operandStack.push (int (token)) 

else: 
operand2 = operandStack.pop() 
operandl = operandStack.pop() 
result = doMath(token, operandl, operand2) 
operandStack.push (result) 


return operandStack.pop() 


def doMath(op, opl, op2): 





EE OB Ss 
returi :OBL * :GB2 
Elif OB. Sa MA 
return opl / op2 
elif “op == +": 
return opl + op2 
else: 
return opl - op2 





需要 注意 的 是 , 在 后 序 表达 式 的 转换 和 计算 中 ,我们 都 假设 输入 表达 式 没有 错误 。 在 以 上 两 





个 程序 的 基础 上 ， 添 加 错误 检测 和 报告 功能 并 不 难 。 本 章 最 后 将 此 作为 一 个 编程 练习 。 
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3.4 ”队列 


接 下 来 学 习 另 一 个 线性 数据 结构 : 队列。 与 栈 类 似 ， 队 列 本 身 十 分 简单 ， 却 能 用 来 解决 众多 
重要 问题 。 
3.4.1 何谓 队列 

队列 是 有 序 集合 ， 添 加 操作 发 生 在 “尾部 ”， 移 除 操作 则 发 生 在 “ 头 部 ”。 新 元 素 从 尾部 进入 
队列 ， 然 后 一 直 向 前 移动 到 头 部 ， 直 到 成 为 下 一 个 被 移 除 的 元 素 。 

最 新 添加 的 元 素 必须 在 队列 的 尾部 等 待 , 在 队列 中 时 间 最 长 的 元 素 则 排 在 最 前 面 。 这 种 排序 
原则 被 称 作 FIFO ( first-in first-out )， 即 先进 先 出 ， 也 称 先 到 先 得 。 

在 日 常 后 活 中 ,我们 经 常 排队 ， 这 便 是 最 简单 的 队列 例子 。 进 电影 院 要 排队 ,在 超市 结账 要 
排队 ， 买 咖啡 也 要 排队 ( 等 着 从 盘子 栈 中 取 盘 子 )。 好 的 队列 只 人 允许 一 头 进 ， 另 一 头 出 ， 不 可 能 
发 生 插队 或 者 中 途 离开 的 情况 。 图 3-12 展示 了 一 个 由 Python 数据 对 象 组 成 的 简单 队列 。 






































尾部 一 一 一 > 8.4 True "dog" 4 一 一 一 一 一 -J> 头 部 





元 素 

图 3-12 ”由 Python 数据 对 象 组 成 的 队列 

计算 机 科学 中 也 有 众多 的 队列 例子 。 我 的 计算 机 实验 室 有 30 台 计 算 机 ， 它 们 都 与 同一 台 打 
印 机 相连 。 当 学 生 需 要 打印 的 时 候 , 他们 的 打印 任务 会 进入 一 个 队列 。 该 队列 中 的 第 一 个 任务 就 
是 即将 执行 的 打印 任务 。 如 果 一 个 任务 排 在 队列 的 最 后 面 , 那么 它 必须 等 到 前 面 的 任务 都 执行 完 
毕 后 才能 执行 。 我 们 稍 后 会 更 深入 地 探讨 这 个 有 趣 的 例子 。 

操作 系统 使 用 一 些 队 列 来 控制 计算 机 进程 。 调 度 机 制 往往 基于 一 个 队列 算法 , 其 目标 是 尽 可 
能 快 地 执行 程序 ， 同 时 服务 尽 可 能 多 的 用 户 。 在 打字 时 , 我 们 有 时 会 发 现 字 符 出 现 的 速度 比 击 键 
速度 慢 。 这 是 由 于 计算 机 正在 做 其 他 的 工作 。 击 键 操 作 被 放 入 一 个 类 似 于 队列 的 缓冲 区 ， 以便 对 
应 的 字符 按 正 确 的 顺序 显示 。 


3.4.2 ”队列 抽象 数据 类 型 


队列 抽象 数据 类 型 由 下 面 的 结构 和 操作 定义 。 如 前 所 述 ， 队 列 是 元 素 的 有 序 集合 ,添加 操作 
发 生 在 其 尾部 ， 移 除 操作 则 发 生 在 头 部 。 队 列 的 操作 顺序 是 FIFO， 它 支持 以 下 操作 。 
口 Queue () 创建 一 个 空 队列 。 它 不 需要 参数 ， 且 会 返回 一 个 空 队列 。 
口 enqueue (item) 在 队列 的 尾部 添加 一 个 元 素 。 它 需要 一 个 元 素 作 为 参数 ， 不 返回 任何 值 。 
D aeaqueue () 从 队列 的 头 部 移 除 一 个 元 素 。 它 不 需要 参数 ， 且 会 返回 一 个 元 素 ， 并 修改 队 
列 的 内 容 。 
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口 isEmpty () 检查 队列 是 否 为 空 。 它 不 需要 参数 ， 且 会 返回 一 个 布尔 值 。 
D size() 返 回 队 列 中 元 素 的 数目 。 它 不 需要 参数 ， 且 会 返回 一 个 整数 。 


假设 a 是 一 个 新 创建 的 空 队列 。 表 3-5 展示 了 对 a 进行 一 系列 操作 的 结果 。 在 “队列 内 容 ” 一 
列 中 , 队列 的 头 部 位 于 右 端 。4 是 第 一 个 被 添加 到 队列 中 的 元 素 , 因此 它 也 是 第 一 个 被 移 除 的 元 素 。 


表 3-5 ”队列 操作 示例 









































队列 操作 队列 内 容 返回 值 
q.isEmpty () | True 
q.enqueue (4) 4] 
q.enqueue ('dog') 'dog', 4] 
dq.enqueue (True) True, 'dog', 4] 
q.size() True, 'dog', 4] 3 
q.isEmpty () True dog', 4] False 
qdq.enqueue (8.4) 8.47 "True, "G60g",- 述 ] 
gq.dequeue () 8.4, True, 'dog'] 4 
dq.dequeue () 8.4, True] dog 
q.size() 8.4, True] 训 








3.4.3 用 Python 实现 队列 

创建 一 个 新 类 来 实现 队列 抽象 数据 类 型 是 十 分 合理 的 。 像 之 前 一 样 , 我 们 利用 简洁 强大 的 列 
表 来 实现 队列 。 

需要 确定 列表 的 哪 一 端 是 队列 的 尾部 ， 哪 一 端 是 头 部 。 代 码 清单 3-9 中 的 实现 假设 队列 的 尾 
部 在 列表 的 位 置 0 处。 如 此 一 来 , 便 可 以 使 用 insert 函数 向 队列 的 尾部 添加 新 元 素 。pop 则 可 
用 于 移 除 队列 头 部 的 元 素 (列表 中 的 最 后 一 个 元 素 )。 这 意味 着 添加 操作 的 时 间 复 杂 度 是 O(n) ， 
移 除 操作 则 是 0(1) 。 


代码 清单 3-9 ”用 了 Python 实现 队列 




















1 class Queue: 

2 def __ init _(self): 

3 self.items = [] 

4 

5 def isEmpty (self): 

6 return self.items == [|] 
7 

8 def enqueue (self, item): 

9 self.items.insert (0, item) 
10 

1 二 def dequeue (self): 

2 return self.items.pop() 
3 

14 def size(self): 


15 return len(self.items) 





3.4 ”队列 77 





以 下 展示 了 表 3-5 中 的 队列 操作 及 其 返回 结果 。 


>>> q = Queue() 
>>> q.isEmpty () 
True 

>>> q.enqueue 
>>> qdq.enqueue 
>>> q = Queue 
>>> q.isEmpty 


('dog') 
(4) 
() 
() 


True 

>>> q.enqueue (4) 

>>> q.enqueue('dog') 
>>> qdq.endueue (True) 
>>> q.size() 

3 

>>> q.isEmpty () 
False 





>>> q.enqueue(8.4) 
>>> q.dequeue () 


>>> q.dequeue() 
'dog' 

>>> q.size() 

2 


3.4.4 模拟 : 传 土豆 


展示 队列 用 法 的 一 个 典型 方法 是 模拟 需要 以 FIFO 方式 管理 数据 的 真实 场景 。 考 虑 这 样 一 个 
儿童 游戏 : 传 土豆 。 在 这 个 游戏 中 ， 孩 子 们 围 成 一 圈 ， 并 依次 尽 可 能 快 地 传递 一 个 土豆 ， 如 图 
3-13 所 示 。 在 某 个 时 刻 ， 大 家 停止 传递 ， 此 时 手 里 有 土豆 的 孩子 就 得 退出 游戏 。 重 复 上 述 过 程 ， 
直到 只 剩 下 一 个 孩子 。 

















Brad 出 局 传 土豆 
CD 
停止 传递 传 土豆 





图 3-13 六 人 传 土豆 游戏 
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这 个 游戏 其 实 等 价 于 著名 的 约 倒 


家 。 相 传 ， 约 倒 


取 义 。 于 是 ,他们 半 成 一 图 ， 从 某 个 人 开始 ， 按 顺 时 针 方向 杀 掉 第 7 人 。 约 瑟 


成 就 的 数学 家 。 据说 , 他 立刻 找到 了 自己 应 该 站 的 位 置 , 从 而 使 自己 活 到 了 最 后 。 当 只 剩 下 他 时 ， 


















































新 间 题 。 弗 拉 维 奥 约瑟夫 斯 是 公元 1 世纪 著名 的 历史 学 
斯 当年 和 39 个 战友 在 山洞 中 对 抗 罗 马 军队 。 有 眼看 着 即将 失败 ， 他 们 决定 仿生 











斯 同时 也 是 卓 有 



































约瑟夫 斯 加 入 了 罗马 军队 ， 而 不 是 自杀 。 这 个 故事 有 很 多 版 本 ， 有 的 说 是 每 隔 两 个 人 ， 有 的 说 最 





后 一 个 人 可 以 骑 


我 们 将 针对 传 土豆 游戏 实现 通用 的 模拟 程序 。 该 程序 接受 
量 num， 并 且 返 回 最 后 一 人 的 名 字 。 至 于 这 个 人 之 后 如 何 ， 就 由 你 来 决定 吧 。 





马 逃 跑 。 不 管 如 何 ， 问 题 都 是 一 样 的 。 








个 名 字 列 表 和 





个 用 于 计数 的 党 


我 们 使 用 队列 来 模拟 一 个 环 ， 如 图 3-14 所 示 。 假 设 握 着 士 豆 的 孩子 位 于 队列 的 头 部 。 在 模 
中 ,程序 将 这 个 孩子 的 名 字 移 出 队列 ， 然 后 立刻 将 其 插 和 人 队列 的 尾部 。 随 后 ， 这 
待 ， 直 到 再 次 到 达 队 列 的 头 部 。 在 出 列 和 入 列 num 次 之 后 ， 此 时 位 于 队列 头 部 
的 孩子 出 局 ， 新 一 轮 游戏 开始 。 如 此 反复 ， 直 到 队列 中 只 剩 下 一 个 名 字 《〈 队列 的 大 小 为 1 )。 


拟 传 士 豆 的 过 程 
个 孩子 会 一 直 等 














尾部 一 一 > Brad Kent Jane Susan David Bill 一 > 庆 音 





A 列 和 移 到 尼 闻 4 一 4 
(传递 十 豆 ) 





尾部 一 一 > Bill Brad Kent Jane Susan ”David 一 -> 头 部 








图 3-14 ”使 用 队列 模拟 传 土豆 游戏 


代码 清单 3-10 展示 了 对 应 的 程序 。 





代码 清单 3-10” 传 土豆 模拟 程序 

from Pythondqs .basic import Queue 
2 def hotPotato(namelist, num): 

3 simqueue = Queue() 

4 for name in namelist: 

5 simaqueue.engqueue (name) 

6 

7 while simqueue.size() > 1: 

8 for i in range (num): 

9 simgqueue.enqueue (simqueue.dequeue () ) 
10 

半生 simgqueue.dequeue() 

生活 

13 return simqueue.dequeue() 





调用 hotPotato 函数 ,使 用 7 作为 计数 常量 ， 将 得 到 以 下 结果 。 
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>>> hotPotato(["Bill", "David", "Susan", "Jane", "Kent", "Brad"], 7) 
" Susan ' 


注意 ,在 上 例 中 ,计数 常量 大 于 列表 中 的 名 字 个 数 。 这 不 会 造成 问题 ， 因 为 队列 模拟 了 一 个 
环 。 同时 需要 注意 , 当 名 字 列 表 载 人 队列 时 , 列表 中 的 第 一 个 名 字 出 现在 队列 的 头 部 。 在 上 例 中 ， 
Bill 是 列表 中 的 第 一 个 元 素 ， 因 此 处 在 队列 的 最 前 端 。 

在 章 末 的 编程 练习 中 ， 你 将 修改 这 一 实现 ， 使 程序 允许 随机 计数 。 























3.4.5 模拟: 打印 任务 


一 个 更 有 趣 的 例子 是 模拟 前 文 提 到 的 打印 任务 队列 。 学生 向 共享 打印 机 发 送 打 印 请 求 , 这 些 
打印 任务 被 存在 一 个 队列 中 , 并 且 按 照 先 到 先 得 的 顺序 执行 。 这样 的 设 定 可 能 导致 很 多 问题 。 其 
中 最 重要 的 是 , 打印 机 能 否 处 理 一 定量 的 工作 。 如 果 不 能 , 学 生 可 能 会 由 于 等 待 过 长 时 间 而 错过 
要 上 的 课 。 

考虑 计算 机 科学 实验 室 里 的 这 样 一 个 场景 : 在 任何 给 定 的 一 小 时 内 ， 实 验 室 里 都 有 约 10 个 
学 生 。 他 们 在 这 一 小 时 内 最 多 打印 2 次 ,并 且 打 印 的 页 数 从 1 到 20 不 等 。 实 验 室 的 打印 机 比较 
老 旧 ， 每 分 钟 只 能 以 低 质 量 打印 10 页 。 可 以 将 打印 质量 调 高 ， 但 是 这 样 做 会 导致 打印 机 每 分 钟 
只 能 打印 5 页。 降低 打印 速度 可 能 导致 学 生 等 待 过 长 时 间 。 那 么 ， 应 该 如 何 设 置 打 印 速 度 呢 ? 

可 以 通过 构建 一 个 实验 室 模型 来 解决 该 问题 。 我 们 需要 为 学 生 .打印 任务 和 打印 机 构建 对 象 ， 
如 图 3-15 所 示 。 当 学 生 提交 打印 任务 时 ， 我 们 需要 将 它们 加 入 等 待 列表 中 ， 该 列表 是 打印 机 上 
的 打印 任务 队列 。 当 打印 机 执行 完 一 个 任务 后 , 它 会 检查 该 队列 , 看 看 其 中 是 否 还 有 需要 处 理 的 
任务 。 我 们 感 兴趣 的 是 学 生平 均 需 要 等 待 多 久 才 能 拿 到 打印 好 的 文章 。 这 个 时 间 等 于 打印 任务 在 
队列 中 的 平均 等 待 时 间 。 

计算 机 




























































































二 一 一 一 > 任务 任务 任务 任务 1 


= 打印 任务 队列 














图 3-15 ”模拟 打印 任务 队列 
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在 模拟 时 ， 需 要 应 用 一 些 概率 学 知识 。 举 例 来 说 ， 学 生 打 印 的 文章 可 能 有 1~20 页 。 如 果 各 
页 数 出 现 的 概率 相等 ， 那 么 打印 任务 的 实际 时 长 可 以 通过 1~20 的 一 个 随机 数 来 模拟 。 
如 果实 验 室 里 有 10 个 学 生 , 并 且 在 一 小 时 内 每 个 人 都 打印 两 次 , 那么 每 小 时 平均 就 有 20 个 
打印 任务 。 在 任意 一 秒 , 创建 一 个 打印 任务 的 概率 是 多 少 ? 回答 这 个 问题 需要 考虑 任务 与 时 间 的 
比值 。 每 小 时 20 个 任务 相当 于 每 180 秒 1 个 任务 。 





] 小 时 ”60 分 60 秒 180 秒 

可 以 通过 1~180 的 一 个 随机 数 来 模拟 每 秒 内 产生 打印 任务 的 概率 。 如 果 随 机 数 正 好 是 180, 那 
么 就 认为 有 一 个 打印 任务 被 创建 。 注 意 , 可 能 会 出 现 多 个 任务 接连 被 创建 的 情况 , 也 可 能 很 长 一 段 
时 间 内 都 没有 任务 。 这 就 是 模拟 的 本 质 。 我 们 希望 在 常用 参数 已 知 的 情况 下 尽 可 能 准确 地 模拟 。 

1. 主要 模拟 步骤 

下 面 是 主要 的 模拟 步骤 。 

(1) 创建 一 个 打印 任务 队列 。 每 一 个 任务 到 来 时 都 会 有 一 个 时 间 戳 。 一 开始 ， 队 列 是 空 的 。 

(2) 针对 每 一 秒 ( currentSecong )， 执 行 以 下 操作 。 
口 是否 有 新 创建 的 打印 任务 ? 如 果 是 ， 以 currentseconqd 作为 其 时 间 戳 并 将 该 任务 加 入 
到 队列 中 。 
口 如 果 打 印 机 空闲 ， 并 且 有 正在 等 待 执行 的 任务 ， 执 行 以 下 操作 : 

里 从 队列 中 取出 第 一 个 任务 并 提交 给 打印 机 ; 

昌 用 currentSecong 减 去 该 任务 的 时 间 戳 ， 以 此 计算 其 等 待 时 间 ; 

@ 将 该 任务 的 等 待 时 间 存 入 一 个 列表 ， 以 备 后 用 ; 

和 根据 该 任务 的 页 数 ， 计 算 执 行 时 间 。 
口 打印 机 进行 一 秒 的 打印 ， 同 时 从 该 任务 的 执行 时 间 中 减 去 一 秒 。 
口 如 果 打 印 任务 执行 完毕 ， 或 者 说 任务 需要 的 时 间 减 为 0， 则 说 明 打 印 机 回 到 空闲 状态 。 

(3) 当 模 拟 完 成 之 后 ， 根 据 等 待 时 间 列 表 中 的 值 计算 平均 等 待 时 间 。 

2. Python 实现 

我 们 创建 3 个 类 : Printer、Task 和 Printoueue。 它 们 分 别 模拟 打印 机 、 打 印 任务 和 
队列 。 

Printer 类 (代码 清单 3-11 ) 需要 检查 当前 是 否 有 待 完 成 的 任务 。 如 果 有 ， 那 么 打印 机 就 
处 于 工作 状态 (第 13~17 行 )， 并 且 其 工作 所 需 的 时 间 可 以 通过 要 打印 的 页 数 来 计算 。 其 构造 方 
法 会 初始 化 打印 速度 ， 即 每 分 钟 打 印 多 少 页 。tick 方法 会 减 量 计时 ， 并 且 在 执行 完 任 务 之 后 将 
打印 机 设置 成 空闲 状态 (第 11 行 )。 





20 个 任务 小时! 分 1 个 任务 
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代码 清单 3-11 Printer 类 











全 class Printer: 

多 def _ init__(self, ppm): 

self.pagerate = ppm 

4 self.currentTask = None 

5 self.timeRemaining = 0 

6 

7 def tick(self): 

8 if self.currentTask != None: 

9 self.timeRemaining = self.timeRemaining - 1 
10 if self.timeRemaining <= 0: 

11 self.currentTask = None 

12 

1 3 def busy (self): 

14 if self.currentTask != None: 

加 return True 

16 else: 

Le: return False 

18 

19 def startNext (self, newtask): 

20 self.currentTask = newtask 

全 self.timeRemaining = newtask.getPages() \ 
2 * 60/self.pagerate 








Task 类 (代码 清单 3-12 ) 代表 单个 打印 任务 。 当 任务 被 创建 时 ， 随 机 数 生 成 器 会 随机 提供 
页 数 ， 取 值 范围 是 1~20。 我 们 使 用 random 模块 中 的 randrange 函数 来 生成 随机 数 。 


>>> import random 

>>> random.randrange(1, 21) 
18 

>>> random.randrange(1, 21) 
8 




















代码 清单 3-12 Task 类 





1 import random 

2 class Task: 

3 def _ init__ (self, time): 

4 self.timestamp = time 

5 self.pages = random.randrange(1, 21) 
6 

8 





def getStamp (self): 
return self.timestamp 

9 
10 def getPages (self): 
于 于 return self.pages 
i2 
13 def waitTime(self, currenttime): 
14 return currenttime - self.timestamp 











每 一 个 任务 都 需要 保存 一 个 时 间 戳 , 用 于 计算 等 待 时 间 。 这 个 时 间 惟 代表 任务 被 创建 并 放 入 
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打印 任务 队列 的 时 间 。waitTime 方法 可 以 获得 任务 在 队列 中 等 待 的 时 间 。 


主 模拟 程序 ( 代码 清单 3-13 ) 实现 了 之 前 描述 的 算法 。printoueue 对 象 是 队列 抽象 数据 类 
型 的 实例 ,布尔 辅助 函数 newPrintTask 判 断 是 否 有 新 创建 的 打印 任务 ,我 们 再 一 次 使 用 random 
模块 中 的 randrange 函数 来 生成 随机 数 ， 不 过 这 一 次 的 取 值 范围 是 1~180。 平均 每 180 秒 有 一 
个 打印 任务 。 通 过 从 随机 数 中 选取 180 (第 34 行 )， 可 以 模拟 这 个 随机 事件 。 该 模拟 程序 允许 设 
置 总 时 间 和 打印 机 每 分 钟 打印 多 少 页 。 


代码 清单 3-13 ”打印 任务 模拟 程序 


















































中 from Pythonds .basic import Queue 

2 

3 import random 

4 

与 def simulation (numSeconds, pagesPerMinute): 

6 

7 labprinter = Printer(pagesPerMinute) 

8 printQueue = Queue() 

9 waitingtimes = [] 

10 

下 亚 for currentSecond in range (numSeconds ) : 

下 次 

3 if newPrintTask(): 

14 task = Task (currentSecond) 

15 printQueue.enqueue (task) 

16 

到 if (not labprinter.busy()) and \ 

18 (not printQueue.isEmpty()): 

1 nexttask = printQueue.dequeue() 

20 waitingtimes.appendl( \ 

2 nexttask.waitTime (currentSecond)) 
2 多 labprinter.startNext (nexttask) 

23 

24 labprinter.tick() 

25 

26 averageWait=sum(waitingtimes)/len(waitingtimes) 
27 print ("Average Wait %6.2f secs %3d tasks remaining."\ 
28 S$ (averageWait, printQueue.size())) 
29 

30 

3 于 

32 def newPrintTask(): 

33 num = random.randrange(1, 181) 

34 if num == 180: 

35 return True 

36 else: 

37 return False 














每 次 模拟 的 结果 不 一 定 相 同 。 对 此 , 我 们 不 需要 在 意 。 这 是 由 于 随机 数 的 本 质 导 致 的 。 我 们 
感 兴趣 的 是 当 参 数 改变 时 结果 出 现 的 趋势 。 下 面 是 一 些 结果 。 
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>>>for i in range(10): 
simulation(3600, 5) 


Average Wait 165.38 secs 2 tasks remaining. 


Average Wait 95.07 secs 1 tasks remaining. 
Average Wait 65.05 secs 2 tasks remaining. 
Average Wait 99.74 secs 1 tasks remaining. 


Average Wait 17.27 secs 0 tasks remaining. 
Average Wait 239.61 secs 5 tasks remaining. 
Average Wait 75.11 secs 1 tasks remaining. 
Average Wait 48.33 secs 0 tasks remaining. 
Average Wait 39.31 secs 3 tasks remaining. 
Average Wait 376.05 secs 1 tasks remaining. 


首先 , 模拟 60 分 钟 (3600 秒 ) 内 打印 速度 为 每 分 钟 5 页。 并且, 我 们 进行 10 次 这 样 的 模拟 。 
由 于 模拟 中 使 用 了 随机 数 ， 因 此 每 次 返回 的 结果 都 不 同 。 

在 模拟 10 次 之 后 , 可 以 看 到 平均 等 待 时 间 是 122.092 秒 , 并 且 等 待 时 间 的 差异 较 大 ,从 最 短 
的 17.27 秒 到 最 长 的 376.05 秒 。 此 外 ， 只 有 2 次 在 给 定时 间 内 完成 了 所 有 任务 。 

现在 把 打印 速度 改 成 每 分 钟 10 页 ， 然 后 再 模拟 10 次 。 由 于 加 快 了 打印 速度 ， 因 此 我 们 希望 
一 小 时 内 能 完成 更 多 打印 任务 。 


>>>for i in range(10): 
simulation(3600, 10) 






























































Average Wait 1.29 secs 0 tasks remaining. 
Average Wait 7.00 secs 0 tasks remaining. 
Average Wait 28.96 secs 1 tasks remaining. 
Average Wait 13.55 secs 0 tasks remaining. 
Average Wait 12.67 secs 0 tasks remaining. 
Average Wait 6.46 secs 0 tasks remaining. 
Average Wait 22.33 secs 0 tasks remaining. 
Average Wait 12.39 secs 0 tasks remaining. 
Average Wait 7.27 secs 0 tasks remaining. 
Average Wait 18.17 secs 0 tasks remaining. 


3. 讨论 

在 之 前 的 内 容 中 , 我 们 试图 解答 这 样 一 个 问题 : 如 果 提 高 打印 质量 并 降低 打印 速度 ,打印 机 
能 否 及 时 完成 所 有 任务 ?我 们 编写 了 一 个 程序 来 模拟 随机 提交 的 打印 任务 , 待 打 印 的 页 数 也 是 随 
机 的 。 

上 面 的 输出 结果 显示 ， 按 每 分 钟 5 页 的 打印 速度 , 任务 的 等 待 时 间 在 17.27 秒 和 376.05 秒 之 
间 ， 相 差 约 6 分 钟 。 提 高 打印 速度 之 后 ， 等 待 时 间 在 1.29 秒 和 28.96 秒 之 间 。 此 外 ， 在 每 分 钟 5 
页 的 速度 下 ，10 次 模拟 中 有 8 次 没有 按时 完成 所 有 任务 。 

可 见 ， 降低 打印 速度 以 提高 打印 质量 ,并 不 是 明智 的 做 法 。 学 生 不 能 等 待 太 长 时 间 ， 当 他 们 
要 赶 去 上 课时 尤其 如 此 。6 分 钟 的 等 待 时 间 实 在 是 太 长 了 。 

这 种 模拟 分 析 能 帮助 我 们 回答 很 多 “如 果 ” 问 题 。 只 需 改变 参数 ， 就 可 以 模拟 感 兴趣 的 任意 
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行为 。 以 下 是 几 个 例子 。 
口 如 果实 验 室 里 的 学 生 增 加 到 20 个 ， 会 怎么 样 ? 
口 如 果 是 周 六 ， 学 生 不 需要 上 课 ， 他 们 是 否 愿意 等 待 ? 
口 如 果 每 个 任务 的 页 数 变 少 了 ， 会 怎么 样 ? ( 因为 Python 既 强大 又 简洁 ， 所 以 学 生 不 必 写 
太 多 行 代码 。 ) 
这 些 问 题 都 能 通过 修改 本 例 中 的 模拟 程序 来 解答 。 但 是 , 模拟 的 准确 度 取决 于 它 所 基于 的 假 
设 和 人 参数。 真实 的 打印 任务 数量 和 学 生 数 目 是 准确 构建 模拟 程序 必 不 可 缺 的 数据 。 


3.5 双 端 队列 


接 下 来 学 习 男 一 个 线性 数据 结构 。 与 栈 和 队列 不 同 的 是 ， 双 端 队列 的 限制 很 少 。 注意 , 不 要 
把 它 的 英文 名 deque( 与 deck 同音 ) 和 队列 的 移 除 操作 aecueue 搞 混 了 。 
















































































3.5.1 何谓 双 端 队列 
双 端 队列 是 与 队列 类 似 的 有 序 集合 。 它 有 一 前 、 一 后 两 端 ， 元 素 在 其 中 保持 自己 的 位 置 。 与 
队列 不 同 的 是 , 双 端 队列 对 在 哪 一 端 添 加 和 移 除 元 素 没有 任何 限制 ,新 元 素 既 可 以 被 添加 到 前 端 ， 
也 可 以 被 添加 到 后 端 。 同 理 , 已 有 的 元 素 也 能 从 任意 一 端 移 除 。 某 种 意义 上 ， 双 端 队 列 是 栈 和 队 
列 的 结合 。 图 3-16 展示 了 由 Python 数据 对 象 组 成 的 双 端 队列 。 
后 端 前 端 




















向 后 端 添加 元 素 向 前 端 添加 元 素 
"dog" 4 "Tea" True 
从 后 端 移 除 元 素 元 素 从 前 端 移 除 元 素 

















图 3-16 由 Python 数据 对 象 组 成 的 双 端 队列 


值得 注意 的 是 , 尽管 双 端 队列 有 栈 和 队列 的 很 多 特性 , 但 是 它 并 不 要 求 按照 这 两 种 数据 结构 
分 别 规定 的 LIFO 原则 和 FIFO 原则 操作 元 素 。 具 体 的 排序 原则 取决 于 其 使 用 者 。 


3.5.2” 双 端 队列 抽象 数据 类 型 
双 端 队列 抽象 数据 类 型 由 下 面 的 结构 和 操作 定义 。 如 前 所 述 ， 双 端 队列 是 元 素 的 有 序 集合 ， 
其 任何 一 端 都 允许 添加 或 移 除 元 素 。 双 端 队列 支持 以 下 操作 。 
口 Deque () 创建 一 个 空 的 双 端 队列 。 它 不 需要 参数 ， 且 会 返回 一 个 空 的 双 端 队列 。 
D addFront (item) 将 一 个 元 素 添 加 到 双 端 队列 的 前 端 。 它 接受 一 个 元 素 作为 参数 ， 没 有 
返回 值 。 
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口 addRear (item) 将 一 个 元 素 添 加 到 双 端 队列 的 后 端 。 它 接受 一 个 元 素 作 为 参数 ， 没 有 返 
回 值 。 
口 removeFront () 从 双 端 队列 的 前 端 移 除 一 个 元 素 。 它 不 需要 参数 ， 且 会 返回 一 个 元 素 ， 
并 修改 双 端 队列 的 内 容 。 
口 removeRear () 从 双 端 队列 的 后 端 移 除 一 个 元 素 。 它 不 需要 
并 修改 双 端 队列 的 内 容 。 
口 isEmpty () 检 查 双 端 队列 是 否 为 空 。 它 不 需要 参数 ， 且 会 返回 一 个 布尔 值 。 
D size() 返 回 双 端 队列 中 元 素 的 数目 。 它 不 需要 参数 ， 且 会 返回 一 个 整数 。 

假设 a 是 一 个 新 创建 的 空 双 端 队列 ， 表 3-6 展示 了 对 a 进行 一 系列 操作 的 结果 。 注 意 ， 前 端 
在 列表 的 右 端 。 记 住 前 端 和 后 端的 位 置 可 以 防止 混淆 。 





Re 


数 ， 且 会 返回 一 个 元 素 ， 



































表 3-6 ” 双 端 队列 操作 示例 





双 端 队列 操作 双 端 队列 内 容 返回 值 
d.isEmpty () ] True 
d.addRear (4) 4] 
d.addRear ('dog') 'dog',4] 
d.addFront ('cat') 'dog', 4, 'cat'] 
d.addFront (True) 人 
d.size() dog 进 ; "agate Trae] 4 
d.isEmpty () i'dog', 4 "oat'y Troe] False 
d.addRear (8.4) 8 "Hog dy oat 1 Te 
d.removeRear () "deg .dy Gat, Trusl | 
d.removeFront () 人 True 











3.5.3 用 Python 实现 双 端 队列 


和 前 几 节 一 样 , 我 们 通过 创建 一 个 新 类 来 实现 双 端 队列 抽象 数据 类 型 。 Python 列表 再 一 次 提 
供 了 很 多 简便 的 方法 来 帮助 我 们 构建 双 端 队列 。 在 代码 清单 3-14 中 ,我 们 假设 双 端 队列 的 后 端 
是 列表 的 位 置 0 处 。 


代码 清单 3-14 用 Python 实现 双 端 队列 









































4 class Deque: 

2 def _ init _(self): 

3 self.items = [] 

4 

5 def isEmpty (self): 

6 return self.items == [] 
7 

8 def addFront (self, item): 

9 self.items.append (item) 
10 

11 def addRear (self, item): 


Co 
CN 
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self.items.insert (0, item) 


def removeFront (self): 
return self.items.pop() 


def removeRear (self): 
return self.items.pop(0) 





def size(self): 
return lenl(self.items) 


卢 品 \ 避 oo~ On 性 ww 


DO PP Pl 








removeFront 使 用 pop 方法 移 除 列表 中 的 最 后 一 个 元 素 ，removeRear 则 使 用 pop (0) 方 
法 移 除 列表 中 的 第 一 个 元 素 。 同 理 ， 之 所 以 adaaqRear 使 用 insert 方法 ， 是 因为 appeng 方法 
只 能 在 列表 的 最 后 添加 元 素 。 


以 下 展示 了 表 3-6 中 的 双 端 队列 操作 及 其 返回 结 


>>> Q = Deque() 
>>> d.isEmpty () 
True 
>>> 





























d.addRear (4) 
d.addRear ('dog') 
>>> d.addFront ('cat') 
d.addFront (True) 
>>> d.size() 
4 
>>> d.isEmpty () 
False 
>>> d.addRear (8.4) 
>>> d.removeRear () 
8.4 
>>> d.removeFront () 
True 


实现 双 端 队列 的 Python 代码 与 实现 栈 和 队列 的 有 许多 相似 之 处 。 在 双 端 队列 的 Python 实现 
中 ， 在 前 端 进行 的 添加 操作 和 移 除 操作 的 时 间 复 杂 度 是 OQ) ， 在 后 端的 则 是 0(n) 。 考 虑 到 实现 
时 采用 的 操作 ， 这 不 难 理解 。 再 次 强调 ， 记 住 前 后 端的 位 置 非常 重要 。 











3.5.4 回 文 检测 器 


运用 双 端 队列 可 以 解决 一 个 非常 有 趣 的 经 典 问题 : 回 文 问题 。 回 文 是 指 从 前 往 后 读 和 从 后 往 
前 读 都 一 样 的 字符 串 ， 例 如 radar 、toot， 以 及 madam。 我 们 将 构建 一 个 程序 ， 它 接受 一 个 字符 串 
并 且 检 测 其 是 否 为 回 文 。 

该 问题 的 解决 方案 是 使 用 一 个 双 端 队列 来 存储 字符 串 中 的 字符 。 按 从 左 往 右 的 顺序 将 字符 
串 中 的 字符 添加 到 双 端 队列 的 后 端 。 此 时 ， 该 双 端 队列 类 似 于 一 个 普通 的 队列 。 然 而 ， 可 以 利 
用 双 端 队列 的 双重 性 , 其 前 端 是 字符 串 的 第 一 个 字符 , 后 端 是 字符 串 的 最 后 一 个 字符 , 如 图 3-17 
所 示 。 
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向 后 端 添加 radar 


后 端 前 端 
添加 








从 后 端 移 除 元 素 从 前 端 移 除 
I r 


从 前 端 和 后 端 移 除 元 素 
图 3-17 双 端 队列 示例 
由 于 可 以 从 前 后 两 端 移 除 元 素 , 因此 我 们 能 够 比较 两 个 元 素 , 并且 只 有 在 二 者 相等 时 才 继 续 。 
如 果 一 直 匹 配 第 一 个 和 最 后 一 个 元 素 ， 最 终 会 处 理 完 所 有 的 字符 ( 如 果 字 符 数 是 偶数 )， 或 者 剩 
下 只 有 一 个 元 素 的 双 端 队列 ( 如 果 字 符 数 是 奇数 )。 任 意 一 种 结果 都 表明 输入 字符 串 是 回 文 。 代 
码 清单 3-15 展示 了 完整 的 回 文 检测 程序 。 


代码 清单 3-15 ”用 Python 实现 回 文 检测 器 























1 from pythonds.basic import Deque 

2 def palchecker (aString): 

3 chardeque = Deque() 

4 

5 for ch in aString: 

6 chardeque.addRear (ch) 

7 

8 stillEqual = True 

9 

10 while chardeque.size() > 1 and stillEqual: 
于 生 first = chardeque.removeFront () 
12 last = chardeque.removeRear () 
43 if first != last: 

14 stillEqual = False 

15 

16 return stillEqual 





调用 palchecker 也 数 的 示例 如 下 所 示 。 
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>>> palchecker ("lsdkjfskf") 
False 

>>> palchecker ("toot") 

True 


3.6 ”列表 


本 章 使 用 了 Python 列表 来 实现 其 他 抽象 数据 类 型 。 列 表 是 简洁 而 强大 的 元 素 集 合 ， 它 为 程 
序 员 提 供 了 很 多 操作 。 但 是 ,并非 所 有 编程 语言 都 有 列表 。 对 于 不 提供 列表 的 编程 语言 ， 程 序 员 
必须 自己 动手 实现 。 

列表 是 元 素 的 集合 ， 其 中 每 一 个 元 素 都 有 一 个 相对 于 其 他 元 素 的 位 置 。 更 具体 地 说 ， 这 种 
列表 称 为 无 序列 表 。 可 以 认为 列表 有 第 一 个 元 素 、 第 二 个 元 素 、 第 三 个 元 素 ， 等 等 ; 也 可 以 称 第 
一 个 元 素 为 列表 的 起 点 , 称 最 后 一 个 元 素 为 列表 的 终点 。 为 简单 起 见 , 我 们 假设 列表 中 没有 重复 
元 素 。 

假设 54, 26, 93, 17, 77, 31 是 考试 分 数 的 无 序列 表 。 注 意 ， 列 表 通 常 使 用 逗号 作为 分 隔 符 。 这 
个 列表 在 Python 中 显示 为 [54，26，93，17，77，31]。 


3.6.1 无 序列 表 抽 象 数据 类 型 


如 前 所 述 , 无 序列 表 是 元 素 的 集合 ， 其 中 每 一 个 元 素 都 有 一 个 相对 于 其 他 元 素 的 位 置 。 以 下 
是 无 序列 表 文 持 的 操作 。 
口 List () 创 建 一 个 空 列表 。 它 不 需要 参数 ， 日 会 返回 一 个 空 列表 。 
口 ada (item) 假设 元 素 item 之 前 不 在 列表 中 ， 并 向 其 中 添加 item。 它 接受 一 个 元 素 作 为 
参数 ， 无 返回 值 。 
口 remove (item) 假设 元 素 itenm 已 经 在 列表 中 ， 并 从 其 中 移 除 item。 它 接受 一 个 元 素 作 
为 参数 ， 并 且 修 改 列 表 。 
D search (item) 在 列表 中 搜索 元 素 item。 它 接受 一 个 元 素 作 为 参数 ， 并 且 返 回 布尔 值 。 
口 1sEmpty () 检查 列表 是 否 为 空 。 它 不 需要 参数 ， 并 且 返 回 布尔 值 。 
口 Ilength () 返 回 列 表 中 元 素 的 个 数 。 它 不 需要 参数 ， 并 且 返 回 一 个 整数 。 
口 append (item) 假设 元 素 item 之 前 不 在 列表 中 ， 并 在 列表 的 最 后 位 置 添加 item。 它 接 
受 一 个 元 素 作 为 参数 ， 无 返回 值 。 
口 jndex (item) 假 设 元 素 item 已 经 在 列表 中 ， 并 返回 该 元 素 在 列表 中 的 位 置 。 它 接受 一 
个 元 素 作 为 参数 ， 并 且 返 回 该 元 素 的 下 标 。 
D insert (pos，item) 假 设 元 素 itenm 之 前 不 在 列表 中 ， 同 时 假设 pos 是 合理 的 值 ， 并 在 
位 置 pos 处 添加 元 素 item。 它 接受 两 个 参数 ， 无 返回 值 。 
口 pop () 假设 列表 不 为 空 ， 并 移 除 列表 中 的 最 后 一 个 元 素 。 它 不 需要 参数 ， 且 会 返回 一 个 

元 素 。 
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口 pop (pos) 假 设 在 指定 位 置 pos 存在 元 素 ， 并 移 除 该 位 置 上 的 元 素 。 
且 会 返回 一 个 元 素 。 





3.6.2 ”实现 无 序列 表 : 链表 


它 接 受 位 置 参数 ， 

















为 了 实现 无 序列 表 , 我 们 要 构建 链表 。 无 序列 表 需 要 维持 元 素 之 间 的 相对 位 置 , 但 是 并 不 需 
要 在 连续 的 内 存 空间 中 维护 这 些 位 置信 息 。 以 图 3-18 中 的 元 素 集合 为 例 ， 这 些 元 素 的 位 置 看 上 














去 都 是 随机 的 。 如 果 可 以 为 每 一 个 元 素 维护 一 份 信息 ， 即 下 一 个 元 素 的 位 置 
那么 这 些 元 素 的 相对 位 置 就 能 通过 指向 下 一 个 元 素 的 链接 来 表示 。 


























17 
31 
26 
54 
77 
93 
图 3-18 看 似 随意 摆 放 的 元 素 
17 
31 ( 尾 ) 
26 
头 
54 
77 
93 


图 3-19 通过 链接 维护 相对 位 置信 息 






































( 如 图 3-19 所 示 )， 


需要 注意 的 是 , 必须 指明 列表 中 第 一 个 元 素 的 位 置 。 一 旦 知道 第 一 个 元 素 的 位 置 ,就 能 根据 
其 中 的 链接 信息 访问 第 二 个 元 素 , 接着 访问 第 三 个 元 素 , 依 此 类 推 。 指 向 链表 第 一 个 元 素 的 引用 














被 称 作 头 。 最 后 一 个 元 素 需要 知道 自己 没有 下 一 个 元 素 。 


1. Node 类 





节点 (node ) 是 构建 链表 的 基本 数据 结构 。 每 一 个 节点 对 象 都 必须 持 有 至 少 两 份 信息 。 首 先 ， 
节点 必须 包含 列表 元 素 , 我 们 称 之 为 节点 的 数据 变量 。 其次, 节点 必须 保存 指向 下 一 个 节点 的 引用 。 
代码 清单 3-16 展示 了 Node 类 的 Python 实现 。 在 构建 节点 时 ， 需 要 为 其 提供 初始 值 。 执 行 下 面 的 











是 , 一 般 会 像 图 3-21 








赋值 语句 会 生成 一 个 包含 数据 值 93 的 节点 对 象 , 如 图 3-20 所 示 。 需要 注意 的 


所 示 的 那样 表示 节点 。Node 类 也 包含 访问 和 修改 数据 的 方法 ， 以 及 指向 下 一 个 元 素 的 引用 。 
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>>> temp = Node(93) 
>>> temp .g9etData() 
93 




















图 3-20 节点 对 象 包含 元 素 及 指向 下 一 个 节点 的 引 


temp -一气 2 | 寺 >| 


节点 的 常见 表示 法 





图 3-21 





特殊 的 Python 引用 值 None 在 








工 


ode 类 以 及 之 后 的 链表 中 起 到 了 重要 的 作用 。 指 向 None 的 





引用 代表 着 后 面 没 有 元 素 。 注 意 ，Node 的 构造 方法 将 next 的 初始 值 设 为 None。 由 于 这 有 时 被 


称 为 “将 节点 接地 ”， 因 此 我 们 使 用 接地 符号 来 代表 指向 None 的 引用 。 


将 None 作为 next 的 初 








始 值 是 不 错 的 做 法 。 

代码 清单 3-16 ”Node 类 

下 class Node: 

2 def _ init__ (self, initdata): 
3 self.data = initdata 

4 self.next = None 

5 

6 def getDatal(self): 

return self.data 

8 

a def getNext (self): 

0 return self.next 

来 注 

| 马 def setDatal(lself, newdata): 
13 self.data = newdata 

14 

15 def setNext (self, newnext): 
16 self.next = newnext 





2. UnorderedList 类 











如 前 所 述 ， 无 序列 表 ( unordered list ) 是 基于 节点 集合 来 构建 的 ， 每 一 个 节点 都 通过 显 式 的 
引用 指向 下 一 个 节点 。 只 要 知道 第 一 个 节点 的 位 置 (第 一 个 节点 包含 第 一 个 元 素 )， 其 后 的 每 一 








个 元 素 都 能 通过 下 一 个 引用 找到 。 因 此 ，UnorderegList 类 必须 包含 指向 第 一 个 节点 的 引用 。 
每 一 个 列表 对 象 都 保存 了 指向 列 


代码 清单 3-17 展示 了 UnorderedList 类 的 构造 方法 。 注 意 ， 
表 头 部 的 引用 。 
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代码 清单 3-17 UnorgderedList 类 的 构造 方法 


二 class UnorderedList: 
2 def _ init _ (selft) : 
3 self.head = None 











最 开始 构建 列表 时 ， 其 中 没有 元 素 。 赋 值 语句 mylist = UnorderedList () 将 创建 如 图 
3-22 所 示 的 链表 。 与 在 Noge 类 中 一 样 ， 特 殊 引 用 值 None 用 于 表明 列表 的 头 部 没有 指向 任何 节 
点 。 最 终 ， 前 面 给 出 的 样 例 列表 将 由 如 图 3-23 所 示 的 链表 来 表示 。 列 表 的 头 部 指向 包含 列表 第 
一 个 元 素 的 节点 。 这 个 节点 包含 指向 下 一 个 节点 (元 素 ) 的 引用 , 依 此 类 推 。 非常 重要 的 一 点 是 ， 
列表 类 本 身 并 不 包含 任何 节点 对 象 ， 而 只 有 指向 整个 链表 结构 中 第 一 个 节点 的 引用 。 


sO Ey 
区 攻 


图 3-22” 空 列表 























mylist 














图 3-23 ”由 整数 组 成 的 链表 


在 代码 清单 3-18 中 ，isEmpty 方法 检查 列表 的 头 部 是 否 为 指向 None 的 引用 。 布 尔 表 达 式 
self.head == None 当 且 仅 当 链表 中 没有 节点 时 才 为 真 。 由 于 新 的 链表 是 空 的， 因此 构造 方法 
必须 和 检查 是 否 为 空 的 方法 保持 一 致 。 这 体现 了 使 用 None 表示 链表 未 尾 的 好 处 。 在 Python 中 ， 
None 可 以 和 任何 引用 进行 比较 。 如 果 两 个 引用 都 指向 同一 个 对 象 ， 那 么 它们 就 是 相等 的 。 我 们 
将 在 后 面 的 方法 中 经 常 使 用 这 一 特性 。 


代码 清单 3-18 :isEmpty 方法 


工 def isEmpty (self): 
多 return self.head == None 























为 了 将 元 素 添 加 到 列表 中 ， 需 要 实现 ada 方法 。 但 在 实现 之 前 ,需要 解决 一 个 重要 问题 : 
新 元 素 要 被 放 在 链表 的 哪个 位 置 ? 由 于 本 例 中 的 列表 是 无 序 的 , 因此 新 元 素 相 对 于 已 有 元 素 的 位 
置 并 不 重要 。 新 的 元 素 可 以 在 任意 位 置 。 因 此 ， 将 新 元 素 放 在 最 简便 的 位 置 是 最 合理 的 选择 。 

由 于 链表 只 提供 一 个 人 口 〈 头 部 )， 因 此 其 他 所 有 节点 都 只 能 通过 第 一 个 节点 以 及 next 链 
接 来 访问 。 这 意味 着 添加 新 节点 最 简便 的 位 置 就 是 头 部 ， 或 者 说 链表 的 起 点 。 我 们 把 新 元 素 作为 
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列表 的 第 一 个 元 素 ， 并 且 把 已 有 的 元 素 链 接 到 该 元 素 的 后 面 。 
通过 多 次 调用 ada 方法 ， 可 以 构建 出 如 图 3-23 所 示 的 链表 。 





>>> mylist.add(31 
>>> mylist.addl( 
>>> mylist.addl( 
>>> mylist.addl( 
>>> mylist.addl( 
>>> mylist.addl( 


注意 ， 由 于 31 是 第 一 个 被 加 入 列表 的 元 素 ， 因 此 随 着 后 续 元 素 不 断 被 加 入 列表 ， 它 最 终 成 
了 最 后 一 个 元 素 。 同 理 ， 由 于 54 是 最 后 一 个 被 添加 的 元 素 ， 因 此 它 成 为 链表 中 第 一 个 节点 的 数 
据 值 。 


代码 清单 3-19 展示 了 ad 方法 的 实现 。 列 表 中 的 每 一 个 元 素 都 必须 被 存放 在 一 个 节点 对 象 
中 。 第 2 行 创建 一 个 新 节点 , 并 且 将 元 素 作 为 其 数据 。 现 在 需要 将 新 节点 与 已 有 的 链表 结构 链接 
起 来 。 这 一 过 程 需要 两 步 ， 如 图 3-24 所 示 。 第 1 步 (第 3 行 ), 将 新 节点 的 next 引用 指向 当前 
列表 中 的 第 一 个 节点 。 这 样 一 来 ,原来 的 列表 就 和 新 节点 正确 地 链接 在 了 一 起 。 第 2 步 ,修改 列 
表 的 头 节点 ， 使 其 指向 新 创建 的 节点 。 第 4 行 的 赋值 语句 完成 了 这 一 操作 。 


代码 清单 3-19 ada 方法 


3 def add(self, item): 

2 temp = Node (item) 

3 temp.setNext (self.head) 
4 self.head = temp 















































TS CE | 9 |- | 17 | [7 | [31 | Ih 








图 3-24 通过 两 个 步骤 添加 新 节点 


上 述 两 步 的 顺序 非常 重要 。 如 果 颠 倒 第 3 行 和 第 4 行 的 顺序 , 会 发 生 什么 呢 ? 如 果 先 修改 列 
表 的 头 节 点 ， 将 得 到 如 图 3-25 所 示 的 结果 。 由 于 头 节 点 是 唯一 指向 列表 节点 的 外 部 引用 ， 因 此 
所 有 的 已 有 节点 都 将 丢失 并 且 无 法 访问 。 
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没有 外 部 引用 


一 ~ 
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re TD DT > 









temp 


图 3-25 ” 先 修改 列表 的 头 节点 将 导致 已 有 节点 丢失 


接 下 来 要 实现 的 方法 length、search 以 及 remove 都 基于 链表 遍历 这 个 技术 。 遍 
历 是 指 系统 地 访问 每 一 个 节点 , 具体 做 法 是 用 一 个 外 部 引用 从 列表 的 头 节点 开始 访问 。 随 着 访问 
每 一 个 节点 ， 我 们 将 这 个 外 部 引用 通过 “遍历 ”下 一 个 引用 来 指向 下 一 个 节点 。 

为 了 实现 1ength 方法 ， 需 要 饥 历 链表 并 且 记录 访问 过 多 少 个 节点 。 代 码 清单 3-20 展示 了 
计算 列表 中 节点 个 数 的 Python 代码 。current 就 是 外 部 引用 ， 它 在 第 2 行 中 被 初始 化 为 列表 的 
头 节点 。 在 计算 开始 时 ， 由 于 没有 访问 到 任何 节点 ， 因 此 count 被 初始 化 为 0。 第 4~6 行 实现 
遍历 过 程 。 只 要 current 引用 没有 指向 列表 的 结尾 (None )， 就 将 它 指 向 下 一 个 节点 (第 6 行 )。 
引用 能 与 None 进行 比较 ， 这 一 特性 非常 重要 。 每 当 current 指向 一 个 新 节点 时 ， 将 count 加 
1。 最 终 ， 循 环 完成 后 返回 count。 图 3-26 展示 了 整个 处 理 过 程 。 


代码 清单 3-20 1lengtn 方法 





















































工 def length(self) : 

有 2 current = self.head 

3 GOUunt Es0 

4 while current != None: 

5 count = count + 1 

6 current = current .getNext () 
县 

8 return count 





遍历 一 一 一 一 一 一 一 > 


current current current current current current current 
[ [ 1 1 1 1 
[ ] ] 


] 
] ] 1 
1 二 1 
1 1 1 
1 1 1 


v ' v ' v v 
head -| 54 | 十 26| 十- 台 93 | 十 -可 17| 二 77 | 十 -对 31| Ih 
图 3-26 从头 到 尾 遍 历 链表 


在 无 序列 表 中 搜索 一 个 值 同 样 也 会 用 到 遍历 技术 。 每 当 访 问 一 个 节点 时 , 检查 该 节点 中 的 元 
素 是 否 与 要 搜索 的 元 素 相同 。 在 搜索 时 ， 可 能 并 不 需要 完整 遍历 列表 就 能 找到 该 元 素 。 事 实 上 ， 



































94 第 3 章 基本 数据 结构 











如 果 遍 历 到 列表 的 末尾 ， 就 意味 着 要 找 的 元 素 不 在 列表 中 。 如 果 在 遍历 过 程 中 找到 所 需 的 元 素 ， 
就 没有 必要 继续 遍历 了 。 

代码 清单 3-21 展示 了 search 方法 的 实现 。 与 在 length 方法 中 相似 ,遍历 从 列表 的 头 部 
开始 (第 2 行 )。 我 们 使 用 布尔 型 变量 foung 来 标记 是 否 找到 所 需 的 元 素 。 由 于 一 开始 时 并 未 找 
到 该 元 素 ， 因 此 第 3 行将 founag 初始 化 为 False。 第 4 行 的 循环 既 考 虑 了 是 否 到 达 列 表 末尾 ， 
也 考虑 了 是 和 否 已 经 找到 目标 元 素 。 只 要 还 有 未 访问 的 节点 并 且 还 没有 找到 目标 元 素 ， 就 继续 检查 
下 一 个 节点 。 第 5 行 检查 当前 节点 中 的 元 素 是 否 为 目标 元 素 。 如 果 是 ， 就 将 found 设 为 True。 


代码 清单 3-21 search 方法 



































下 def search(self, item): 

用 current = self.head 

3 found = False 

4 while current != None and not found: 
5 if current.getData() == item: 

6 found = True 

7 else: 

8 current = current .getNext() 
9 

10 return found 





以 下 调用 search 方法 来 寻找 元 素 17。 


>>> mylist.search(17) 
True 





由 于 17 在 列表 中 ， 因 此 遍历 过 程 只 需 进 行 到 含有 17 的 节点 即 可 。 此 时 ，foung 变量 被 设 
为 True， 从 而 使 while 循环 退出 ， 最 终 得 到 上 面 的 输出 结果 。 图 3-27 展示 了 这 一 过 程 。 





遍历 ”一 一 一 一 一 > 


oUFESrit Tt Et WE Gt 
1 ] 








图 3-27 成 功 搜索 到 元 素 17 


remove 方法 在 逻辑 上 需要 分 两 步 。 第 1 步 ， 遍历 列 表 并 查找 要 移 除 的 元 素 。 一 旦 找到 该 元 
素 (假设 元 素 在 列表 中 )， 就 必须 将 其 移 除 。 第 1 步 与 search 非常 相似 。 从 一 个 指向 列表 头 节 
点 的 外 部 引用 开始 , 遍历 整个 列表 , 直到 遇 到 需要 移 除 的 元 素 。 由 于 假设 目标 元 素 已 经 在 列表 中 ， 
因此 我 们 知道 循环 会 在 current 抵达 None 之 前 结束 。 这 意味 着 可 以 在 判断 条 件 中 使 用 布尔 型 


光量 ounaa 
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当 found 被 设 为 True 时 ，current 将 指向 需要 移 除 的 节点 。 该 如 何 移 除 它 呢 ? 一 种 做 法 
是 将 节点 包含 的 值 奉 换 成 表示 其 已 被 移 除 的 值 。 这 种 做 法 的 问题 是 ,节点 的 数量 和 元 素 的 数量 不 
再 匹配 。 更 好 的 做 法 是 移 除 整个 节点 。 

为 了 将 包含 元 素 的 节点 移 除 ， 需 要 将 其 前 面 的 节点 中 的 next 引用 指向 current 之 后 的 节 
点 。 然而, 并 没有 反 向 遍历 链表 的 方法 。 由 于 current 已 经 指向 了 需要 修改 的 节点 之 后 的 节点 ， 
此 时 做 修改 为 时 已 晚 。 

这 一 困境 的 解决 方法 就 是 在 遍历 链表 时 使 用 两 个 外 部 引用 。current 与 之 前 一 样 ， 标 记 在 
链表 中 的 当前 位 置 。 新 的 引用 previous 总 是 指向 current 上 一 次 访问 的 节点 。 这 样 一 来 ， 当 
current 指向 需要 被 移 除 的 节点 时 ，previous 就 刚好 指向 真正 需要 修改 的 节点 。 

代码 清单 3-22 展示 了 完整 的 remove 方法 。 第 2~3 行 对 两 个 引用 进行 初始 赋值 。 注 意 ， 
current 与 其 他 遍历 例子 一 样 ， 从 列表 的 头 节点 开始 。 由 于 头 节 点 之 前 没有 别 的 节点 ， 因 此 
previous 的 初始 值 是 None， 如 图 3-28 所 示 。 布 尔 型 变量 foung 再 一 次 被 用 来 控制 循环 。 


代码 清单 3-22 remove 方法 

































































1 def remove(self, item): 

2 current = self.head 

六 previous = None 

4 found = False 

5 while not found: 

6 if current.getData() == item: 

7 found = True 

8 else: 

9 previous = current 

10 Current = current .getNext() 
1 

政信 if previous == None: 

3 self.head = current .getNext () 
14 else: 

5 previous.setNext (current .getNext () 





previous 一 -外 


Ge 


head 





图 3-28 previous 和 current 的 初始 值 


A 


第 6~7 行 检查 当前 节点 中 的 元 素 是 否 为 要 移 除 的 元 素 。 如 果 是 ,就 设 found 为 True。 如 果 
否 , 则 将 previous 和 current 往 前 移动 一 次 。 这 两 条 语句 的 顺序 十 分 重要 。 必 须 先 将 previous 
移动 到 current 的 位 置 ， 然后 再 移动 current。 这 一 过 程 经 常 被 称 为 “蠕动 "， 因 为 previous 
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必须 在 current 向 前 移动 之 前 指向 其 当前 位 置 。 图 3-29 展示 了 在 遍历 列表 寻找 包含 17 的 节点 
的 过 程 中 ，previous 和 current 的 移动 过 程 。 


previous 





步骤 current 


ove (ETH ED A A ES SIE 


previous current 


1 head ED [61 7 


previous current 


2 hesa (EE 


previous current 


3 head 54 26 人 17 77 | 二 31 > ||! 
= = 


图 3-29 previous 和 current 的 移动 过 程 


一 旦 搜索 过 程 结束 ， 就 需要 执行 移 除 操作 。 图 3-30 展示 了 修改 过 程 。 有 一 种 特殊 情况 需要 
注意 : 如 果 被 移 除 的 元 素 正好 是 链表 的 第 一 个 元 素 , 那么 current 会 指向 链表 中 的 第 一 个 节点 ， 
previous 的 值 则 是 None。 在 这 种 情况 下 ， 需 要 修改 链表 的 头 节 点 ， 而 不 是 previous 指向 的 
节点 ， 如 图 3-31 所 示 。 


















































previous current 





图 3-30 移 除 位 于 链表 中 段 的 节点 


previous 一 一 | 


current 





图 3-31 移 除 链表 中 的 第 一 个 节点 


第 12 行 检查 是 否 遇 到 上 述 特殊 情况 。 如 果 previous 没有 移动 , 当 founa 被 设 为 True 时 ， 
它 的 值 仍 然 是 None。 在 这 种 情况 下 (第 13 行 )， 链 表 的 头 节点 被 修改 成 指向 当前 头 节点 的 下 一 
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个 节点 ， 从 而 达到 移 除 头 节点 的 效果 。 但 是 ， 如 果 previous 的 值 不 是 None， 则 说 明 需 要 移 除 
的 节点 在 链表 结构 中 的 某 个 位 置 。 在 这 种 情况 下 ，previous 指向 了 next 引用 需要 被 修改 的 节 
点 。 第 15 行使 用 previous 的 setNext 方法 来 完成 移 除 操作 。 注 意 , 在 两 种 情况 中 , 修改 后 的 
引用 都 指向 current .getNext () 。 一 个 常 被 提 及 的 问题 是 , 已 有 的 逻辑 能 否 处 理 移 除 最 后 一 个 
节点 的 情况 。 这 个 问题 留 给 你 来 思考 。 

剩 下 的 方法 appenda、insert 、index 和 pop 都 留 作 练习 。 注 意 ， 每 一 个 方法 都 需要 考虑 
操作 是 发 生 在 链表 的 头 节 点 还 是 别 的 位 置 。 此 外 ，insert 、index 和 pop 需要 提供 元 素 在 链表 
中 的 位 置 。 请 假设 位 置 是 从 0 开始 的 整数 。 


3.6.3 ”有 序列 表 抽 象 数据 类 型 


接 下 来 学 习 有 序列 表 。 如 果 前 文中 的 整数 列表 是 以 升序 排列 的 有 序列 表 ， 那 么 它 会 被 写作 
17, 26, 31, 54, 77, 93。 由 于 17 是 最 小 的 元 素 ， 因 此 它 就 成 了 列表 的 第 一 个 元 素 。 同 理 ， 由 于 93 
是 最 大 的 元 素 ， 因 此 它 在 列表 的 最 后 一 个 位 置 。 


在 有 序列 表 中 , 元素 的 相对 位 置 取 决 于 它们 的 基本 特征 。 它 们 通常 以 升序 或 者 降序 排列 ,并 
且 我 们 假设 元 素 之 间 能 进行 有 意义 的 比较 。 有 序列 表 的 众多 操作 与 无 序列 表 的 相同 。 


口 orderedList () 创 建 一 个 空 有 序列 表 。 它 不 需要 参数 ， 且 会 返回 一 个 空 列表 。 
Daaq(item) 假 设 item 之 前 不 在 列表 中 ， 并 向 其 中 添加 item， 同 时 保持 整个 列表 的 顺 
序 。 它 接受 一 个 元 素 作为 参数 ， 无 返回 值 。 

口 remove (item) 假设 item 已 经 在 列表 中 ， 并 从 其 中 移 除 item。 它 接受 一 个 元 素 作 为 参 
数 ， 并 且 修 改 列 表 。 

口 search (item) 在 列表 中 搜索 item。 它 接受 一 个 元 素 作 为 参数 ， 并 且 返 回 布尔 值 。 

口 1sEmpty () 检查 列表 是 否 为 空 。 它 不 需要 参数 ， 并 且 返 回 布尔 值 。 

口 length () 返 回 列 表 中 元 素 的 个 数 。 它 不 需要 参数 ， 并 且 返 回 一 个 整数 。 

口 ingex (item) 假 设 item 已 经 在 列表 中 ， 并 返回 该 元 素 在 列表 中 的 位 置 。 它 接受 一 个 元 
素 作为 参数 ， 并 且 返 回 该 元 素 的 下 标 。 

D pop () 假设 列表 不 为 空 ， 并 移 除 列 表 中 的 最 后 一 个 元 素 。 它 不 需要 参数 ， 且 会 返回 一 个 
元 素 。 

口 pop (pos) 假设 在 指定 位 置 pos 存在 元 素 ， 并 移 除 该 位 置 上 的 元 素 。 它 接受 位 置 参数 ， 
且 会 返回 一 个 元 素 。 


























































































































3.6.4 ”实现 有 序列 表 


在 实现 有 序列 表 时 必须 记 住 , 元 素 的 相对 位 置 取决 于 它们 的 基本 特征 。 整数 有 序列 表 17, 26， 
31, 54, 77, 93 可 以 用 如 图 3-32 所 示 的 链 式 结构 来 表示 。 
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图 3-32 ”有 序列 表 





orderedList 类 的 构造 方法 与 UnorderedList 类 的 相同 。head 引用 指向 None， 代 表 这 
是 一 个 空 列 表 ， 如 代码 清单 3-23 所 示 。 
代码 清单 3-23 orgderegdList 类 的 构造 方法 
1 class OrderedList: 


def _ init_ (self): 
3 self.head = None 














因为 isEmpty 和 1lengtn 仅 与 列表 中 的 节点 数目 有 关 ， 而 与 实际 的 元 素 值 无 关 ， 所 以 这 两 
个 方法 在 有 序列 表 中 的 实现 与 在 无 序列 表 中 一 样 。 同 理 , 由 于 仍然 需要 找到 目标 元 素 并 且 通 过 更 
改 链接 来 移 除 节 点 ， 因 此 remove 方法 的 实现 也 一 样 。 剩 下 的 两 个 方法 ，search 和 adqda， 需 要 
做 一 些 修改 。 

在 无 序列 表 中 搜索 时 ， 需 要 逐个 遍历 节点 ， 直 到 找到 目标 节点 或 者 没有 节点 可 以 访问 。 这 个 
方法 同样 适用 于 有 序列 表 , 但 前 提 是 列表 包含 目标 元 素 。 如 果 目 标 元 素 不 在 列表 中 ,可 以 利用 元 
素 有 序 排列 这 一 特性 尽早 终止 搜索 。 

举 一 个 例子 。 图 3-33 展示 了 在 有 序列 表 中 搜索 45 的 情况 。 从 列表 的 头 节 点 开始 遍历 ,首先 
比较 45 和 17。 由 于 17 不 是 要 查找 的 元 素 , 因此 移 向 下 一 个 节点 , 即 26。 它 也 不 是 要 找 的 元 素 ， 
所 以 继续 向 前 比较 31 和 之 后 的 54。 由 于 54 不 是 要 查找 的 元 素 ， 因 此 在 无 序列 表 中 ， 我 们 会 继 
续 搜 索 。 但是, 在 有 序列 表 中 不 必 这 么 做 。 一 旦 节点 中 的 值 比 正在 查找 的 值 更 大 ,搜索 就 立刻 结 
束 并 返回 False。 这 是 因为 ， 要 查找 的 元 素 不 可 能 存在 于 链表 后 序 的 节点 中 。 
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图 3-33 ”在 有 序列 表 中 查找 元 素 


代码 清单 3-24 展示 了 完整 的 search 方法 。 通 过 增加 新 的 布尔 型 变量 stop， 并 将 其 初始 化 
为 False( 第 4 行 ) 可 以 将 上 述 条 件 轻松 整合 到 代码 中 。 当 stop 是 false 时 ， 我 们 可 以 继续 
搜索 链表 (第 5 行 )。 如果 遇 到 其 值 大 于 目标 元 素 的 节点 ， 则 将 stop 设 为 True (第 9~10 行 )。 
之 后 的 代码 与 无 序列 表 中 的 一 样 。 
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代码 清单 3-24 有 序列 表 的 searcn 方法 





def search(self, item): 

入 current = self.head 

3 found = False 

4 stop = False 

Ss while current != None and not foungd and not stop: 
6 if current.getData() == item: 

7 found = True 

8 else: 

9 if current.getData() > item: 

10 stop = True 

中 让 else: 

4 和 2 Current = current .getNext() 
13 

14 return found 




















需要 修改 最 多 的 是 aqa 方法 。 对 于 无 序列 表 ，ada 方法 可 以 简单 地 将 一 个 节点 放 在 列表 的 
头 部 ,这 是 最 简便 的 访问 点 。 不 巧 ， 这 种 做 法 不 适合 有 序列 表 。 我 们 需要 在 已 有 链表 中 为 新 节点 
找到 正确 的 插入 位 置 。 

假设 要 向 有 序列 表 17, 26, 54, 77, 93 中 添加 31。aqa 方法 必须 确定 新 元 素 的 位 置 在 26 和 54 
之 间 。 图 3-34 展示 了 我 们 期 望 的 结果 。 像 之 前 解释 的 一 样 ， 需 要 遍历 链表 来 查找 新 元 素 的 插入 
位 置 。 当 访问 完 所 有 节点 (current 是 None ) 或 者 当前 值 大 于 要 添加 的 元 素 时 ,就 找到 了 插入 
位 置 。 在 本 例 中 ， 遇 到 54 使 得 遍历 过 程 终 止 。 





























previous current 
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图 3-34 向 有 序列 表 中 添加 元 素 


和 无 序列 表 一 样 ， 由 于 current 无 法 提供 对 待 修改 节点 的 访问 ， 因 此 使 用 额外 的 引用 
previous 是 十 分 必要 的 。 代 码 清单 3-25 展示 了 完整 的 ada 方法 。 第 2~3 行 初始 化 两 个 外 部 引 
用 , 第 9~10 行 保证 brevious 一 直 跟 在 current 后 面 。 只 要 还 有 节点 可 以 访问 , 并 且 当 前 节点 
的 值 不 大 于 要 插入 的 元 素 , 判断 条 件 就 会 允许 循环 继续 执行 。 在 循环 停止 时 ， 就 找到 了 新 节点 的 
插入 位 置 。 




















100 第 3 章 基本 数据 结构 





代码 清单 3-25 有 序列 表 的 add 方法 





工 def add(self, item): 
冯 current = self.head 
3 previous = None 
4 stop = False 
5 while current != None andq not stop: 
6 if current .getData() > item: 
7 stop = True 
8 else: 
9 previous = current 
current = current .getNext() 


temp = Node (item) 

if previous == None: 
temp.setNext (self.head) 
self.head = temp 

else: 
temp.setNext (current) 
previous.setNext (temp) 


oo >~OOUD 必 ww 用品 


























一 旦 创建 了 新 节点 ,唯一 的 问题 就 是 它 会 被 添加 到 链表 的 开头 还 是 中 间 某 个 位 置 。previous 














== None (第 13 行 ) 可 以 提供 答案 。 





剩 下 的 方法 留 作 练习 。 需 要 认真 思考 ， 在 无 序列 表 中 的 实现 是 否 可 用 于 有 序列 表 。 


链表 分 析 





在 分 析 链 表 操 作 的 时 间 复 杂 度 时 ， 考 虑 其 是 否 需要 遍历 列表 。 以 有 7 个 节点 的 链表 为 例 ， 
isEmpty 方法 的 时 间 复 杂 度 是 OQ) ， 这 是 因为 它 只 需要 执行 一 步 操作 ， 即 检查 neag 引用 是 否 
为 None。length 方法 则 总 是 需要 执行 n 步 操 作 ， 这 是 因为 上 只 有 完全 遍历 整个 列表 才能 知道 究 
























































竟 有 多 少 个 元 素 。 因 此 ，1lengtn 方法 的 时 间 复 杂 度 是 O(n) 。 向 无 序列 表 中 添加 元 素 是 0() ,这 








是 因为 只 是 简单 地 将 新 节点 放 在 链表 的 第 一 个 位 置 。 但 是 ， 有 序列 表 的 search、re 

















ove 以 及 


adad 都 需要 进行 遍历 操作 。 尽管 它们 平均 都 只 需要 遍历 一 半 的 节点 , 但 是 这 些 方法 的 时 间 复 杂 度 





都 是 O(n) 。 这 是 因为 在 最 坏 情况 下 ， 它 们 都 需要 遍历 所 有 节点 。 
































通过 链表 实现 的 。 实 际 上 ，Python 列表 是 基于 数组 实现 的 。 第 8 章 将 深入 讨论 。 


3.7 小 结 


口 线性 数据 结构 以 有 序 的 方式 来 维护 其 数据 。 

口 栈 是 简单 的 数据 结构 ， 其 排序 原则 是 LIFO， 即 后 进 先 出 。 
口 栈 的 基本 操作 有 push、pop 和 isEmpty。 

口 队列 是 简单 的 数据 结构 ， 其 排序 原则 是 FIFO， 即 先进 先 出 。 
口 队列 的 基本 操作 有 enqueue、dequeue 和 isEmpty。 












































我 们 注意 到 ， 本 节 实 现 的 链表 在 性 能 上 和 Python 列表 有 差异 。 这 意味 着 Python 列表 并 不 是 











口 表达 式 有 3 种 写法 : 前 序 、 中 序 和 后 序 。 

口 栈 在 计算 和 转换 表达 式 的 算法 中 十 分 有 用 。 

口 栈 具有 反 转 特性 。 

口 队列 有 助 于 构建 时 序 模拟 。 

口 模拟 程序 使 用 随机 数 生成 器 来 模拟 实际 情况 ， 并 且 帮 助 我 们 回答 “如 果 ” 问 题 。 
口 双 端 队列 是 栈 和 队列 的 结合 。 

口 双 端 队列 的 基本 操作 有 addFront 、addRear 、removeFront 、removeRear 和 
isEmptyo 

口 列表 是 元 素 的 集合 ， 其 中 每 一 个 元 素 都 有 一 个 相对 于 其 他 元 素 的 位 置 。 

口 链表 保证 逻辑 顺序 ， 对 实际 的 存储 顺序 没有 要 求 。 

口 修改 链表 头 部 是 一 种 特殊 情况 。 


3.8 ”关键 术语 

















FIFO LIFO 遍历 链表 队列 后 序 
回 文 节点 链表 列表 模拟 
匹配 括号 前 序 数据 变量 双 端 队列 头 部 
完全 括号 线性 数据 结构 优先 级 栈 中 序 


3.9 讨论 题 
1. ”使 用 “ 除 以 2” 算法 将 下 列 值 转换 成 二 进 制 数 。 列 出 转换 过 程 中 的 余数 。 
口 17 


口 45 
口 96 


2. 使 用 完全 括号 法 ,将 下 列 中 序 表达 式 转换 成 前 序 表达 式 。 
D(A+B)* (C+ D) 
DA ((BI+C) * (D+ 
DA**B*C*D+BE+ 
3. ”使 用 完全 括号 法 ,将 上 面 的 中 序 表达 式 转换 成 后 序 表达 式 。 

4. ”使 用 直接 转换 法 ,将 上 面 的 中 序 表达 式 转换 成 后 序 表达 式 。 展 示 转 换 过 程 中 栈 的 变化 。 
5. 计算 下 列 后 序 表 达 式 。 展 示 计 算 过 程 中 栈 的 变化 。 

D23*4+ 


D12+3+4+5+ 
D12345*+* 


和 % 





E + F) 
) ) 





十 回 一 
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队列 抽象 数据 类 型 的 另 一 种 实现 方式 是 使 用 列表 , 并 使 得 列表 的 后 端 是 队列 的 尾部 。 这 
种 实现 的 大 O 性 能 如 何 ? 

在 链表 的 ada 方法 中 ， 凑 倒 两 个 步骤 的 执行 顺序 会 是 什么 结果 ? 引用 的 结果 会 是 怎么 
样 ? 会 出 现 什 么 问题 ? 

假设 需要 移 除 链 表 中 的 最 后 一 个 节点 ， 解 释 如 何 实现 remove 方法 。 

假设 链表 只 有 一 个 节点 ， 解 释 如 何 实 现 remove 方法 。 


编程 练习 

修改 从 中 序 到 后 序 的 转换 算法 ， 使 其 能 处 理 异 常情 况 。 

修改 计算 后 序 表达 式 的 算法 ， 使 其 能 处 理 异 常情 况 。 

结合 从 中 序 到 后 序 的 转换 算法 以 及 计算 后 序 表达 式 的 算法 , 实现 直接 的 中 序 计算 。 在 计 
算 时 ,应 该 使 用 两 个 栈 从 左 往 右 处 理 中 序 表达 式 标记 。 一 个 栈 用 于 保存 运算 符 ， 另 一 个 
用 于 保存 操作 数 。 

将 在 练习 3 中 实现 的 算法 做 成 一 个 计算 器 。 

使 用 列表 实现 队列 抽象 数据 类 型 ， 将 列表 的 后 端 作为 队列 的 尾部 。 

设计 和 实现 一 个 实验 ， 对 比 两 种 队列 实现 的 性 能 。 能 从 该 实验 中 学 到 什么 ? 

实现 一 个 队列 , 使 其 添加 操作 和 移 除 操作 的 平均 时 间 复 杂 度 为 O0) 。 这 意味 着 在 大 多 数 
情况 下 ， 两 个 操作 的 时 间 复 森 度 都 是 OQ) ， 仅 在 一 种 特殊 情况 下 ， 移 除 操作 为 O(n) 。 
考虑 现实 生活 中 的 一 个 场景 。 完 整地 定义 问题 , 并 且 设 计 一 个 模拟 来 解答 它 。 以 下 是 一 
些 例 子 : 

口 排队 等 待 洗车 ; 

口 在 超市 等 待 结账 ; 

口 飞机 的 起 飞 和 降落 ; 

口 银行 出 纳 员 。 

口 请 说 明 你 所 做 的 任何 假设 ， 并且 提供 所 需 的 概率 数据 。 

修改 传 土豆 模拟 程序 ， 允 许 随机 计数 ， 从 而 使 每 一 轮 的 结果 都 不 可 预测 。 










































































.实现 一 个 基数 排序 器 。 十 进 制 数 的 基数 排序 利用 1 个 主 桶 和 10 个 数位 桶 。 每 个 桶 就 像 





一 个 队列 , 并 且 根 据 数字 到 达 的 先后 顺序 来 维持 其 中 的 值 。 该 算法 首先 将 所 有 的 数 都 放 
在 主 桶 中 , 然后 按照 数值 中 的 每 一 个 数位 来 考察 这 些 值 。 第 一 个 值 从 主 桶 中 移 除 并 且 根 
据 在 考察 的 数位 将 其 放 到 对 应 的 数位 桶 中 。 如 果 考 察 的 是 个 位 , 那么 534 将 被 放 在 4 号 
数位 桶 中 ，667 则 将 被 放 在 7 号 数位 桶 中 。 一 旦 所 有 的 值 都 被 放 在 了 相应 的 数位 桶 中 ， 
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便 依 次 从 0 号 到 9 号 数位 桶 中 将 值 放 回 主 桶 。 重 复 整 个 过 程 到 数字 的 十 位 、 百 位 等 。 在 
最 后 一 个 数位 被 处 理 完 之 后 ， 主 桶 里 面 就 是 排 好 序 的 值 。 

















， 除 了 本 章 所 举 的 例子 ，HIML 中 也 存在 括号 匹配 问题 。 标 签 有 开始 和 结束 两 种 形式 ,并 


且 需 要 互相 匹配 才能 正确 描述 网 页 内 容 。 下 面 是 简单 的 HTML 文档 ， 用 于 展示 标签 的 
匹配 和 舱 套 。 写 一 个 程序 来 检查 HTML 文档 中 的 标签 是 否 正确 匹配 。 


<html> 
<head> 
<title> 
Example 
</title> 
</head> 


<body> 
<hl>Hello, world</h1> 


</body> 
</html> 
































.扩展 代码 清单 3-15 中 的 回 文 检测 器 ， 使 其 可 以 处 理 包含 空格 的 回 文 。 如 果 忽 略 其 中 的 

















空格 ， 那 么 IPREFER PI 就 是 回 文 。 

















.本章 通过 计算 列表 中 节点 的 个 数 来 实现 1ength 方法 。 另 一 种 做 法 是 将 节点 个 数 作为 额 





外 的 信息 保存 在 列表 头 中 。 请 修改 UnordereaList 类 的 实现 , 使 其 包含 节点 个 数 信息 ， 
并 且 重 新 实现 length 方法 。 








， 实 现 remove 方法 ， 使 其 能 正确 处 理 待 移 除 元 素 不 在 列表 中 的 情况 。 
， 修 改 列表 类 ， 使 其 能 支持 重复 元 素 。 这 一 改动 会 影响 到 哪些 方法 ? 
， 实现 UnorderedList 类 的 ”str_ 方 法。 列表 适合 用 什么 样 的 字符 串 来 表示 ? 


灿 


现 _str_ 方 法, 使 列表 按照 Python 的 方式 来 显示 使 用 方 括号 )。 





将 将 
洁 


.实现 无 序列 表 抽 象 数 据 类 型 剩余 的 方法 : append、index、pop 和 insert。 


UnorderegdList 类 的 slice 方法 。 该 方法 接受 start 和 stop 两 个 参数 , 并 且 返 
一 个 从 start 位 置 开 始 , 到 stop 位 置 结 束 的 新 列表 ( 但 不 包含 stop 位 置 上 的 元 素 )。 
有 序列 表 抽 象 数据 类 型 剩余 的 方法 。 


有 序列 表 和 无 序列 表 的 关系 。 能 否 利用 继承 关系 来 构建 更 高 效 的 实现 ? 试 着 实现 这 
个 继承 结构 。 


站 








将 男 将 


水 污 


也 





Cc 


.使 用 链表 实现 栈 。 

.使 用 链表 实现 队列 。 

.使 用 链表 实现 双 端 队列 。 

.设计 和 实现 一 个 实验 ， 比 较 用 链表 实现 的 列表 与 Python 列表 的 性 能 。 
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26， 设 计 和 实现 一 个 实验 ， 比 较 基 于 Python 列表 的 栈 和 队列 与 相应 链表 实现 的 性 能 。 

27， 由 于 每 个 节点 都 具有 一 个 引用 指向 其 后 的 节点 ， 因 此 本 章 给 出 的 链表 实现 称 为 单 向 链 
表 。 另 一 种 实现 称 为 双向 链表 。 在 这 种 实现 中 ,每 一 个 节点 都 有 指向 后 一 个 节点 的 引用 
(通常 称 为 next ) 和 指向 前 一 个 节点 的 引用 ( 通常 称 为 back )。 头 引用 同样 也 有 两 个 引 
用 ， 一 个 指向 链表 中 的 第 一 个 节点 ， 另 一 个 指向 最 后 一 个 节点 。 请 用 Python 实现 双向 
链表 。 

28， 为 队列 创建 一 个 实现 ， 使 得 添加 操作 和 移 除 操作 的 平均 时 间 复 杂 度 是 OO) 。 























第 4 章 


二 


归 








4.1 本 章 目标 


口 理解 某 些 复杂 的 难题 为 何 可 以 通过 简单 的 递归 解决 。 
口 学 习 如 何 构建 递归 程序 。 

口 理解 和 应 用 递归 三 原则 。 

口 从 循环 的 角度 理解 递归 。 

口 实现 问题 的 递归 解法 。 

口 理解 计算 机 系统 如 何 实现 递归 。 


4.2 何谓 递归 

递归 是 解决 问题 的 一 种 方法 , 它 将 问题 不 断 地 分 成 更 小 的 子 问题 , 直到 子 问题 可 以 用 普通 的 
方法 解决 。 通 常情 况 下 ,递归 会 使 用 一 个 不 停 调用 自己 的 函数 。 尽 管 表 面 上 看 起 来 很 普通 ,但 是 
递归 可 以 帮助 我 们 写 出 非常 优雅 的 解决 方案 。 对 于 某 些 问题 ， 如 果 不 用 递归 ， 就 很 难 解决 。 






























































4.2.1 计算 一 列 数 之 和 





我 们 从 一 个 简单 的 问题 开始 学 习 递 归 。 即 使 不 用 递归 , 我 们 也 知道 如 何 解决 这 个 问题 。 假 设 需 
要 计算 数字 列表 [1，3，5，7，9] 的 和 。 代 码 清单 4-1 展示 了 如 何 通 过 循环 函数 来 计算 结果 。 这 
个 函数 使 用 初始 值 为 0 的 累加 变量 thesum， 通 过 把 列表 中 的 数 加 到 该 变量 中 来 计算 所 有 数 的 和 。 


代码 清单 4-1 循环 求 和 函数 


1 def listsum(numList): 
theSum = 0 
3 for i in numList: 
theSum = theSum + i 
return theSum 








Un 心 




















假设 暂时 没有 while 循环 和 for 循环 。 应 该 如 何 计 算 结 果 呢 ? 如 果 你 是 数学 家 ， 就 会 记得 
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加 法 是 接受 两 个 参数 ( 一 对 数 ) 的 函数 。 将 问题 从 求 一 列 数 之 和 重新 定义 成 求 数字 对 之 和 ， 可 以 
将 数字 列表 重 写成 完全 括号 表达 式 ， 例 如 ((((1 + 3) + 5) + 7) + 9)。 该 表达 式 还 有 另 一 
种 添加 括号 的 方式 ， 即 (1 + (3 + (5 + (7 + 9))))。 注 意 ， 最 内 层 的 括号 对 (7 + 9) 不 用 
循环 或 者 其 他 特殊 语法 结构 就 能 直接 求解 。 事 实 上 ， 可 以 使 用 下 面 的 简化 步 又 来 求 总 和 。 


总 和 =(1+(3+(5+(7+9)))) 
总 和 =(1+(3+(5+16))) 
总 和 =(1+(3+21)) 

总 和 =(1+24) 

总 和 = 25 


如 何 将 上 述 想 法 转换 成 Python 程序 呢 ? 让 我 们 用 Python 列表 来 重新 表述 求 和 问题 。 数 字 列 
表 numList 的 总 和 等 于 列表 中 的 第 一 个 元 素 (numList [0] ) 加 上 其 余 元 素 (numList[1:]) 
之 和 。 可 以 用 函数 的 形式 来 表述 这 个 定义 。 
listSum(numList) = first(numList) + listSum(rest(numList)) 


first(numLis) 返 回 列表 中 的 第 一 个 元 素 , rest(numLis) 则 返回 其 余 元 素 。 用 Python 可 以 轻松 地 
实现 这 个 等 式 ， 如 代码 清单 4-2 所 示 。 


代码 清单 4-2 ”递归 求 和 函数 


1 def listsum(numList): 
if len(numList) == 1: 
return numList [0] 
else: 
return numList[0] + listsum(numList[1:]) 


















































DROD 





在 这 一 段 代码 中 , 有 两 个 重要 的 思想 值得 探讨 。 首先, 第 2 行 检查 列表 是 否 只 包含 一 个 元 素 。 
这 个 检查 非常 重要 ， 同 时 也 是 该 函数 的 退出 语句 。 对 于 长 度 为 1 的 列表 ， 其 元 素 之 和 就 是 列表 
中 的 数 。 其 次 ，1istsum 国 数 在 第 $ 行 调用 了 自己 ! 这 就 是 我 们 将 1istsum 称 为 递归 天 数 的 
原因 一 一 递归 函数 会 调用 自己 。 
图 4-1 展示 了 在 求解 [1，3，5，7，9] 之 和 时 的 一 系列 递归 调用 。 我 们 需要 将 这 一 系列 调 
用 看 作 一 系列 简化 操作 。 每 一 次 递归 调用 都 是 在 解决 一 个 更 小 的 问题 ,如 此 进行 下 去 ， 直 到 问题 
本 身 不 能 再 简化 为 止 。 


















































4.2 ”何谓 递归 107 













人 





图 4-1 求 和 过 程 中 的 递归 调用 


当 问题 无 法 再 简化 时 ， 我 们 开始 拼接 所 有 子 问 题 的 答案 ， 以 此 解决 最 初 的 问题 。 图 4-2 展示 了 Sl 
listsum 函数 在 返回 一 系列 调用 的 结果 时 进行 的 加 法 操作 。 当 它 返 回 到 顶层 时 , 就 有 了 最 终 管 案 。 


25 |- ant 
Sun( :57779) B= 








图 4-2 求 和 过 程 中 的 一 系列 返回 操作 


4.2.2 ”递归 三 原则 
正如 阿 西 莫 夫 提出 的 机 器 人 三 原则 一 样 ， 所 有 的 递归 算法 都 要 遵守 三 个 重要 的 原则 : 
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(1) 递归 算法 必须 有 基本 情况 ; 

(2) 递归 算法 必须 改变 其 状态 并 向 基本 情况 靠近 ; 

(G3) 递归 算法 必须 递归 地 调用 自己 。 

让 我 们 来 看 看 1ist sum 算法 是 如 何 遵守 上 述 原则 的 。 基 本 情况 是 指使 算法 停止 递归 的 条 件 ， 
这 通常 是 小 到 足以 直接 解决 的 问题 。1istsum 算法 的 基本 情况 就 是 列表 的 长 度 为 1。 

为 了 遵守 第 二 条 原则 ， 必须 设 法 改变 算法 的 状态 ,从 而 使 其 向 基本 情况 靠近 。 改 变 状 态 是 指 
修改 算法 所 用 的 某 些 数据 ， 这 通常 意味 着 代表 问题 的 数据 以 某 种 方式 变 得 更 小 。1istsum 算法 
的 主 数据 结构 是 一 个 列表 ， 因 此 必须 改变 该 列表 的 状态 。 由 于 基本 情况 是 列表 的 长 度 为 1， 因 此 
向 基本 情况 靠近 的 做 法 自然 就 是 缩短 列表 。 这 正 是 代码 清单 4-2 的 第 5 行 所 做 的 ， 即 在 一 个 更 短 
的 列表 上 调用 1istsum。 

最 后 一 条 原则 是 递归 算法 必须 对 自身 进行 调用 , 这 正 是 递归 的 定义 。 对 于 很 多 新 手 程序 员 来 
说 ,递归 是 令 他 们 颇 感 困惑 的 概念 。 新 手 程序 员 知 道 如 何 将 一 个 大 问题 分 解 成 众多 小 问题 ， 并 通 
过 编写 函数 来 解决 每 一 个 小 问题 。 然而, 弟 归 似乎 让 他 们 落 入 怪圈 : 有 一 个 需要 用 函数 来 解决 的 
问题 , 但 是 这 个 函数 通过 调用 自己 来 解决 问题 。 其 实 , 递归 的 逻辑 并 不 是 循环 ， 而 是 将 问题 分 解 
成 更 小 、 更 容易 解决 的 子 问题 。 

接 下 来 ,我 们 会 讨论 更 多 的 递归 例子 。 在 每 一 个 例子 中 , 我 们 都 会 根据 递归 三 原则 来 构建 问 
题 的 解决 方案 。 


4.2.3 将 整数 转换 成 任意 进 制 的 字符 串 

假设 需要 将 一 个 整数 转换 成 以 2~16 为 基数 的 字符 串 。 例 如 ,将 10 转换 成 十 进 制 字符 串 "10 "， 
或 者 二 进 制 字 符 串 "1010"。 尽 管 很 多 算法 都 能 解决 这 个 问题 ， 包括 3.3.6 节 讨 论 的 算法 , 但 是 递 
归 的 方式 非常 巧妙 。 


以 十 进 制 整数 769 为 例 。 假 设 有 一 个 字符 序列 对 应 前 10 个 数 ， 比 如 convstring = 
"0123456789"。 若 要 将 一 个 小 于 10 的 数字 转换 成 其 对 应 的 字符 串 ， 只 需 在 字符 序列 中 查找 对 
应 的 数字 即 可 。 例如 ,9 对 应 的 字符 串 是 convstring[191 或 者 "9"。 如 果 可 以 将 整数 769 拆 分 成 
7、6 和 9， 那 么 将 其 转换 成 字符 串 就 十 分 简单 。 因 此 ， 一 个 很 好 的 基本 情况 就 是 数字 小 于 10。 


上 述 基本 情况 说 明 ， 整 个 算法 包含 三 个 组 成 部 分 : 

(D 将 原来 的 整数 分 成 一 系列 仅 有 单数 位 的 数 ; 

(2) 通过 查 表 将 单数 位 的 数 转换 成 字符 串 ; 

(3) 连接 得 到 的 字符 串 ， 从 而 形成 结果 。 

接 下 来 需要 设法 改变 状态 并 且 逐 渐 向 基本 情况 靠近 。 思考 哪些 数学 运算 可 以 缩减 整数 , 最 有 
可 能 的 是 除法 和 减法 。 虽然 减 法 可 能 有 效 , 但 是 我 们 并 不 清楚 应 该 减 去 什么 数 。 让 我 们 来 看 看 将 
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需要 转换 的 数字 除 以 对 应 的 进 制 基数 会 如 何 。 

将 769 除 以 10， 商 是 76, 余数 是 9。 这 样 一 来 ， 我 们 便 得 到 两 个 很 好 的 结果 。 首 先 ， 由 于 
余数 小 于 进 制 基数 ， 因 此 可 以 通过 查 表 直 接 将 其 转换 成 字符 串 。 其 次 ， 得 到 的 商 小 于 原 整数 ， 这 
使 得 我 们 离 基本 情况 更 近 了 一 步 。 下 一 步 是 将 76 转换 成 对 应 的 字符 串 。 再 一 次 运用 除法 ， 得 到 
商 7 和 余数 6。 问 题 终 于 被 简化 到 将 7 转换 成 对 应 的 字符 串 ， 由 于 它 满足 基本 情况 ”< base (其 
中 base 为 10 )， 因 此 转换 过 程 十 分 简单 。 图 4-3 展示 了 这 一 系列 的 操作 。 注 意 ,我 们 需要 记录 的 
数字 是 右 侧 方 框 内 的 余数 。 


















































余数 


图 4-3 将 整数 转换 成 十 进 制 字符 串 
代码 清单 4-3 展示 的 Python 代码 实现 了 将 整数 转换 成 以 2~16 为 进 制 基数 的 字符 串 。 
代码 清单 4-3 ”将 整数 转换 成 以 2~16 为 进 制 基数 的 字符 串 



















def toStr(n, base): 
convertString = "0123456789ABCDEF" 
if n < base: 
return convertString[n] 
else: 
return toStr(n//base, base) + convertString[n%base] 


ONODP 




















第 4 行 检查 是 否 为 基本 情况 , 即 n 小 于 进 制 基数 ,如 果 是 , 则 停止 递归 并 且 从 convertstring 
中 返回 字符 串 。 第 7 行 通 过 递归 调用 以 及 除法 来 分 解 问题 ， 以 同时 满足 第 二 条 和 第 三 条 原则 。 
来 看 看 该 算法 如 何 将 整数 10 转换 成 其 对 应 的 二 进 制 字符 串 "1010"。 
4-4 展示 了 结果 ,但 是 看 上 去 数位 的 顺序 反 了 。 由 于 第 7 行 首 先进 行 递 归 调 用 ， 然 后 才 拼 
接 余 数 对 应 的 字符 串 ， 因 此 程序 能 够 正确 工作 。 如 果 将 convertstring 查找 和 返回 tostr 调 
用 反 转 ， 结 果 字 符 串 就 是 反 转 的 。 但 是 将 拼接 操作 推迟 到 递归 调用 返回 之 后 ， 就 能 得 到 正确 的 结 
果 。 说 到 这 里 ， 你 应 该 能 想起 第 3 章 讨 论 的 栈 。 
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图 4-4 将 整数 10 转换 成 二 进 制 字符 串 


4.3 ” 栈 帧 : 实现 递归 


假设 不 拼接 递归 调用 tostr 的 结果 和 convertstring 的 查找 结果 ， 而 是 在 进行 递归 调用 
之 前 把 字符 串 压 入 栈 中 。 代 码 清单 4-4 展示 了 修改 后 的 实现 。 


代码 清单 4-4 ”把 字符 串 压 入 栈 中 











1 rStack = Stack() 

多 

3 def toStr(n, base): 

4 convertString = "0123456789ABCDEF" 

与 if n < base: 

6 rStack.push (convertStringl[n]) 

7 else: 

8 rStack.push(convertSstring[n % basel]) 
9 tostr(n // base, base) 





每 一 次 调用 tostr, 都 将 一 个 字符 压 入 栈 中 。 回 到 之 前 的 例子 ,可 以 发 现在 第 四 次 调用 tostr 
之 后 , 栈 中 内 容 如 图 4-5 所 示 。 因此 , 只 需 执行 出 栈 操作 和 拼接 操作 , 就 能 得 到 最 终结 果 "1010"。 








图 4-5 栈 中 内 容 
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这 个 例子 展示 了 Python 如 何 实现 递归 函数 调用 。 当 调用 冰 数 时 ，Python 分 配 一 个 栈 帧 来 处 
理 该 函数 的 局 部 变量 。 当 函数 返回 时 ,返回 值 就 在 栈 的 顶端 ， 以 供 调 用 者 访问 。 图 4-6 展示 了 返 
回 语句 之 后 的 调用 栈 。 

















toStr (2//2,2) + convertSstring[2%2] 


toStr (5//2,2) + convertSstring[5%2] 


toStr (10//2,2) + convertString[10g2] 














图 4-6 ”调用 栈 示例 


注意 ， 调 用 tostr(2//2，2) 将 返回 值 "1" 放 在 栈 的 顶端 。 之 后 ， 这 个 返回 值 被 用 来 替换 对 
应 的 函数 调用 (tostr(1，2) ) 并 生成 表达 式 "1" + convertstring[2%2]。 这 一 表达 式 会 将 
字符 串 "10" 留 在 栈 顶 。 通过 这 种 方法 ,Python 的 调用 栈 取 代 了 代码 清单 4-4 显 式 使 用 的 栈 。 在 计 
算 一 列 数 之 和 的 例子 中 ， 可 以 认为 栈 中 的 返回 值 取 代 了 累加 变量 。 

栈 帧 限定 了 函数 所 用 变量 的 作用 域 。 尽 管 反复 调用 相同 的 函数 , 但 是 每 一 次 调用 都 会 为 函数 
的 局 部 变量 创建 新 的 作用 域 。 

如 果 记 住 栈 的 这 种 思想 ， 就 会 发 现 递 归 函 数 写 起 来 很 容易 。 


4.4 ”递归 可 视 化 


前 文 探讨 了 一 些 能 用 递归 轻松 解决 的 问题 。 但 是 , 要 想象 递归 的 样子 或 者 将 递归 过 程 可 视 化 
仍然 十 分 困难 。 这 使 得 递归 难以 掌握 。 本 节 将 探讨 一 系列 使 用 递归 来 绘制 有 趣 图 案 的 例子 。 看 着 
这 些 岁 案 一 点 一 点 地 形成 ， 你 会 对 递归 过 程 有 新 的 认识 ， 从 而 深刻 地 理解 递归 的 概念 。 

我 们 将 使 用 Python 的 turtle 模块 来 绘制 图 案 。Python 的 各 个 版 本 都 提供 turtle 模块 ， 
它 用 起 来 非常 简便 。 顾 名 思 义 ,可 以 用 surtle 模块 创建 一 只 小 乌龟 (turtle ) 并 让 它 向 前 或 向 后 
移动 ， 或 者 左 转 、 右 转 。 小 乌 怨 的 尾巴 可 以 抬 起 或 放下 。 当 尾巴 放下 时 ， 移 动 的 小 乌龟 会 在 其 身 
后 画 出 一 条 线 。 知 要 增加 美观 度 ， 可 以 改变 小 乌龟 尾巴 的 宽度 以 及 尾 尖 所 茧 墨水 的 颜色 。 
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让 我 们 通过 一 个 简单 的 例子 来 展示 小 乌龟 绘 
线 ， 如 代码 清单 4-5 所 示 。 先 导入 turtle 模块 ， 


度 (参数 len ) 降 为 0。 如果 线 的 长 度 大 于 0， 前 


























图 的 过 程 。 使 用 turtle 模块 递归 地 绘制 螺旋 
然后 创建 一 个 小 乌龟 对 象 ， 同 时 也 会 创建 用 于 























所 图 案 的 窗口 。 接 下 来 定义 arawSpiral 国 数 。 这 个 简单 函数 的 基本 情况 是 ， 要 画 的 线 的 长 


让 小 乌 包 向 前 移动 len 个 单位 距离 ， 然 后 向 右 





转 90 度 。 递 归 发 生 在 用 缩短 后 的 距离 再 














次 调用 drawspiral 函数 时 。 代 码 清单 4-5 在 结尾 处 





调用 了 mywi 





n .exitonclick() 函数 , 这 使 小 乌龟 进入 等 待 模式 , 直到 用 户 在 窗口 内 再 次 点 击 之 





后 ， 程 序 清理 并 退出 。 
代码 清单 4-5 用 turtle 模块 递归 地 绘制 螺旋 线 








from turtle import * 


myTurtle = Turtle() 
myWin = myTurtle.getscreen() 
def drawSpiral (myTurtle, lineLen): 
if len > 0: 
myTurtle.forward (lineLen) 
myTurtle.right (90) 
drawSpiral (myTurtle, 


\ 避 oaw 心 wm 


lineLen-5) 


drawSpiral (myTurtle, 
myWin.exitonclick() 


100) 


w N PP 口 








弄 








E 解 了 这 个 例子 的 原型 








用 


ee 
它 总 是 


众多 自然 现象 中 的 分 形 本 质 使 得 程序 
一 棵 分 形 树 。 
思考 如 何 用 分 形 来 描绘 一 棵 树 。 如 前 所 述 ,， 不 论 放大 多 少 倍 ,分 形 


归公 已 
中 肛 








E， 便 能 用 turtle 模块 绘制 漂亮 的 图 案 。 接 下 来 绘 和 
是 数学 的 一 个 分 支 ， 它 与 递归 有 很 多 共同 点 。 分 形 的 定义 是 ， 不 论 放 大 多 少 倍 来 观察 分 形 图 ， 
有 相同 的 基本 形状 。 自 然 界 中 的 分 形 例 子 包括 海岸 线 、 雪 花 、 山 岭 ， 其 至 树木 和 灌木 从 。 
够 用 计算 机 生成 看 似 非 常 真实 的 





判 一 棵 分 形 树 。 分 





电影 画面 。 下 面 来 生成 


图 看 起 来 都 一 样 。 对 于 树 





木 来 说 ， 这 意味 着 即使 是 一 根 小 嫩 枝 也 有 和 一 整 棵 树 一 样 的 形状 和 特征 

















。 借助 这 一 思想 ,可 以 把 





树 定义 为 树干 ,其 上 长 着 一 棵 向 左 生长 的 子 树 和 一 棵 向 右 生 长 的 子 树 。 
义 运用 到 它 的 左右 子 树 上 。 


让 我 们 将 上 述 想 法 转换 成 Python 代码 .代码 清单 4.6 展示 了 如 何 用 turtle 模 块 
第 5 行 在 小 乌龟 向 右 转 了 20 度 之 
7 行 再 一 次 进行 递归 调 月 
旬 左 转 40 度 ， 是 因为 它 首先 需要 抵消 之 前 右 转 的 20 


仔细 研究 这 段 代码 ， 会 发 现 第 5 行 和 第 7 行进 行 了 递归 调用 。 
后 立刻 进行 递归 调用 ， 这 就 是 之 前 提 到 的 右 子 树 。 然 后 ， 第 
在 向 左 转 了 40 度 以 后 。 之 所 以 需要 让 小 乌 


二 


度 ,然后 再 继续 左 转 20 度 来 绘制 左 子 树 。 同 时 注意 ,每 一 次 进行 递归 调用 









































因此 ,可 以 将 树 的 递归 定 


绘 





判 分 形 树 。 








目 ， 但 这 次 是 


时 ,都 从 参数 branchLen 

















中 减 去 一 些 ， 这 是 为 了 让 递归 树 越 来 越 小 。 第 2 行 的 if 语句 会 检查 branchLen 是 否 满足 基本 


情况 。 
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代码 清单 4-6 ”绘制 分 形 树 





二 def tree(branchLen, t): 

2 if branchLen > 5: 
t.forward (branchLen) 
4 t.right (20) 
5 tree(branchLen-15, t) 
6 t.left(40) 
7 tree (branchLen-10, t) 
8 t.right (20) 
9 t.backward (branchLen) 









































请 执行 分 形 树 的 代码 , 但 在 此 之 前 ， 先 想象 一 下 绘制 出 来 的 树 会 是 什么 样 。 这 棵 树 是 如 何 开 
枝 散 叶 的 呢 ? 程 序 是 会 同时 对 称 地 绘制 左右 子 树 ， 还 是 会 先 绘制 右 子 树 再 绘制 左 子 树 ? 在 输入 
tree 函数 的 代码 之 后 ， 可 以 用 下 面 的 代码 来 绘制 一 棵 树 。 


>>> from turtle import * 
>>> 七 = Turtle() 

>>> myWin = 七 .getscreen () 
>>> 七 .Jeft(90) 











>>> 七 .up() 
>>> 七 .backward(300) 
>>> 上 .down () 





>>> t.color('green') 
>>> tree(110, t) 
>>> myWin.exitonclick() 


注意 , 树 上 的 每 一 个 分 支点 都 对 应 一 次 递归 调用 ,而 且 程 序 先 绘制 右 子 树 ,并 一 路 到 其 最 短 
的 嫩 枝 ， 如 图 4-7 所 示 。 接 着 ， 程 序 一 路 反 向 回 到 树干 ， 以 此 绘制 完 右 子 树 ， 如 图 4-8 所 示 。 然 
后 ,开始 绘制 左 子 树 , 但 并 不 是 一 直 往 左 延伸 到 最 左 端的 嫩 枝 。 相 反 ， 左 子 树 自 己 的 右 子 树 被 完 
全 画 好 后 才 会 绘制 最 左 端的 嫩 枝 。 
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图 4-7” 先 绘制 右 子 树 











图 4-8 分 形 树 的 右 半 部 分 
这 个 简单 的 分 形 树 程序 仅仅 是 一 个 开始 。 你 会 注意 到 , 绘制 出 来 的 树 看 上 去 并 不 真实 , 这 是 
由 于 自然 界 并 不 如 计算 机 程序 一 样 对 称 。 在 本 章 最 后 的 练习 中 , 你 将 探索 如 何 绘制 出 看 起 来 更 真 
实 的 树 。 


谢 尔 平 斯 基 三 角形 


另 一 个 具有 自 相 似 性 的 分 形 图 是 谢 尔 平 斯 基 三 角形 ， 如 图 4-9 所 示 。 谢 尔 平 斯 基 三 角形 展示 
了 三 路 递归 算法 。 手动 绘 制 谢 尔 平 斯 基 三 角形 的 过 程 十 分 简单 : 从 一 个 大 三 角形 开始 ,通过 连接 
每 条 边 的 中 点 将 它 分 割 成 四 个 新 的 三 角形 ; 忽略 中 间 的 三 角形 , 利用 同样 的 方法 分 割 其 余 三 个 三 
角形 。 每 一 次 创建 一 个 新 三 角形 集合 ， 都 递归 地 分 割 三 个 三 角形 。 如 果 笔 尖 足 够 细 ， 可 以 无 限 地 
重复 这 一 分 割 过 程 。 在 继续 阅读 之 前 ， 不 妨 试 着 亲手 绘制 谢 尔 平 斯 基 三 角形 。 




































































图 4-9 谢 尔 平 斯 基 三 角形 
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既然 可 以 无 限 地 重复 分 割 算 法 , 那么 它 的 基本 情况 是 什么 呢 ? 答案 是 ,基本 情况 根据 我 们 想 
要 的 分 割 次 数 设 定 。 这 个 次 数 有 时 被 称 为 分 形 图 的 “ 度 "。 每 进行 一 次 递归 调用 ， 就 将 度 减 1， 
直到 度 是 0 为止。 代码 清 单 4-7 展示 了 生成 如 图 4-9 所 示 的 谢 尔 平 斯 基 三 角形 的 代码 。 


代码 清单 4-7 绘制 谢 尔 平 斯 基 三 角形 




















from turtle import * 


1 

2 

3 def drawTriangle(points, color, myTurtle): 

4 myTurtle.fillcolor (color) 

5 myTurtle.up() 

6 myTurtle.goto(points[0]) 

3 myTurtle.down() 

8 myTurtle.begin fill() 

9 myTurtle.goto(points[1]) 
myTurtle.goto(points[2]) 
myTurtle.goto(points[0]) 
myTurtle.end fil1l() 





def getMid(pl, p2): 
return ( (pl1[0]+p2[0]) /2, (pl[1] + p2[1]) / 2) 





def sierpinski (points, degree, myTurtle): 
colormap = ['blue', 'red', 'green', 'white', 'yellow', 
'Vviolet', 'orange'] 
drawTriangle (points, colormapl[ldegree], myTurtle) 
if degree > 0: 
sierpinski([points[0], 
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getMid(points[0], points[1]), 
getMid(points[0], points[2])], 
degree-1, myTurtle) 
sierpinski([points[1], 
27 getMid(points[0], points[1]) 
28 getMid(points[1], points[2])], 
9 degree-1, myTurtle) 
30 sierpinski ([points[2], 
3 getMid(points[2], points[1]), 
32 getMid(points[0], points[2])], 
33 degree-1, myTurtle) 
34 
35 myTurtle = Turtle() 
36 myWin = myTurtle.getscreen() 
37 "nyPointes =- TE(=500, -250)y, {0% 500)., (5900 =250)1 
38 sierpinski (myPoints, 5, myTurtle) 
39 myWin.exitonclick() 





代码 清单 4-7 中 的 程序 遵循 了 之 前 描述 的 思想 。sierpinski 首先 绘制 外 部 的 三 角形 ， 接 着 
进行 3 个 递归 调用 ， 每 一 个 调用 对 应 生成 的 一 个 新 三 角形 。 本 例 再 一 次 使 用 Python 自 带 的 标准 
turtle 模块 。 在 Python 解释 器 中 执行 help('turtle')， 可 以 详细 了 解 turtle 模块 中 的 所 
有 方法 。 
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请 根据 代码 清单 4-7 思考 三 角形 的 绘制 顺序 。 假 设 三 个 角 的 顺序 是 左下 角 、 顶 角 、 右 下 角 。 
于 sierpinski 的 递归 调用 方式 ， 它 会 一 直 在 左下 角 绘制 三 角形 ， 直 到 绘制 完 最 小 的 三 角形 
才 会 往 回 绘制 剩 下 的 三 角形 。 之 后 ， 它 会 开始 绘制 顶部 的 三 角形 ,直到 绘制 完 最 小 的 三 角形 。 最 
后 ， 它 会 绘制 右 下 角 的 三 角形 ， 直 到 全 部 绘制 完成 。 

函数 调用 图 有 助 于 理解 递归 算法 。 由 图 4-10 可 知 ， 递 归 调 用 总 是 往 左边 进行 的 。 在 图 中 ， 
黑 线 表 示 正 在 执行 的 函数 ， 灰 线 表示 没有 被 执行 的 函数 。 越 深入 到 该 图 的 底部 ， 三 角形 就 越 小 。 
函数 一 次 完成 一 层 的 绘制 ; 一 旦 它 绘制 好 底层 左边 的 三 角形 ， 就 会 接着 绘制 底层 中 间 的 三 角形 ， 
依 此 类 推 。 








































































































左下 角 顶 角 右 下 角 


左下 角 顶 角 右 下 角 


SO 


图 4-10 谢 尔 平 斯 基 三 角形 的 函数 调用 图 


sierpinski 函数 非常 依赖 于 getMia 函数 , 后 者 接受 两 个 点 作为 输入 , 并 返回 它们 的 中 点 。 
此 外 ,代码 清单 4-7 中 有 一 个 函数 使 用 turtle 模块 的 begin_fi1l1l 和 end_fi11 绘制 带 颜 色 的 
三 角形 。 这 意味 着 谢 尔 平 斯 基 三 角形 的 每 一 层 都 有 不 同 的 颜色 。 


4.5 复杂 的 递归 问题 


前 几 节 探讨 了 一 些 容 易 用 递归 解决 的 问题 ,以 及 有 助 于 理解 递归 的 一 些 有 趣 的 绘图 问题 。 本 
节 将 探讨 一 些 用 循环 难以 解决 却 能 用 递归 轻松 解决 的 问题 。 最 后 会 探讨 一 个 颇具 欺骗 性 的 问题 。 
它 看 上 去 可 以 用 递归 巧妙 地 解决 ， 但 是 实际 上 并 非 如 此 。 













































































汉 诺 塔 问题 由 法 国 数学 家 爱德华 . 卢 卡 斯 于 1883 年 提出 。 他 的 灵感 是 一 个 与 印度 寺庙 有 关 
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的 传说 ， 相 传 这 座 寺 庙 里 的 年 轻 修 行者 试图 解决 这 个 难题 。 起 初 ， 修 行者 有 3 根 柱子 和 64 个 依 
次 一 好 的 金 盘 子 ， 下面 的 盘子 大 ， 上 面 的 盘子 小 。 修 行者 的 任务 是 将 64 个 释 好 的 盘子 从 一 根 柱 
子 移动 到 男 一 根 柱 子 , 同时 有 两 个 重要 的 限制 条 件 : 每 次 只 能 移动 一 个 盘子 , 并 且 大 盘子 不 能 放 
在 小 盘子 之 上 。 修行 者 夜以继日 地 移动 盘子 ( 每 一 秒 移动 一 个 盘子 ), 试图 完成 任务 。 根 据 传说 ， 
如 果 他 们 完成 这 项 任务 ， 整 座 寺 庙 将 倒塌 ， 整 个 世界 也 将 消失 。 

尽管 这 个 传说 非常 有 意思 ， 但 是 并 不 需要 担心 世界 会 因此 而 毁灭 。 要 正确 移动 64 个 盘子 ， 
所 需 的 步 数 是 2“ - 1 = 18 446 744 073 709 551 615。 根 据 每 秒 移动 一 次 的 速度 ， 整 个 过 程 大 约 需 
要 584 942 417 355 年 ! 显然 ， 这 个 谜 题 并 不 像 听 上 去 那么 简单 。 

图 4-11 展示 了 一 个 例子 ， 这 是 在 将 所 有 盘子 从 第 一 根 柱子 移 到 第 三 根 柱子 的 过 程 中 的 一 个 
中 间 状 态 。 注意, 根据 前 面 说 明 的 规则 ,每 一 根 柱 子 上 的 盘子 都 是 从 下 往 上 由 大 到 小 依次 一 起 来 
的 。 如 果 你 之 前 从 未 求解 过 这 个 问题 ,不妨 现 在 就 斌 一下。 不 需要 精致 的 盘子 和 柱子 , 一 堆 书 或 
者 一 县 纸 就 足够 了 。 



















































































fromPpole withPole toPole 


图 4-11 汉 诺 塔 问题 示例 


如 何 才能 递归 地 解决 这 个 问题 呢 ? 它 真 的 可 解 吗 ? 基本 情况 是 什么 ?让 我 们 自 底 向 上 地 来 
考虑 这 个 问题 。 假 设 第 一 根 柱子 起 初 有 5 个 盘子 。 如 果 我 们 知道 如 何 把 上 面 4 个 盘子 移动 到 第 二 
根 柱子 上 , 那么 就 能 轻易 地 把 最 底下 的 盘子 移动 到 第 三 根 柱子 上 , 然后 将 4 个 盘子 从 第 二 根 柱子 
移动 到 第 三 根 柱子 。 但 是 如 果 不 知道 如 何 移动 4 个 盘子 , 该 怎么 办 呢 ? 如 果 我 们 知道 如 何 把 上 面 
3 个 盘子 移动 到 第 三 根 柱子 上 ， 那 么 就 能 轻易 地 把 第 4 个 盘子 移动 到 第 二 根 柱子 上 ， 然 后 再 把 3 
个 盘子 从 第 三 根 柱子 移动 到 第 二 根 柱子 。 但 是 如 果 不 知道 如 何 移动 3 个 盘子 , 该 怎么 办 呢 ? 移动 
两 个 盘子 到 第 二 根 柱子 ， 然 后 把 第 3 个 盘子 移动 到 第 三 根 柱子 ， 最 后 把 之 前 的 两 个 盘子 移 过 来 ， 
怎么 样 ? 但 是 如 果 还 是 不 知道 如 何 移动 两 个 盘子 , 该 怎么 办 呢 ? 你 肯定 会 说 , 把 一 个 盘子 移动 到 
第 三 根 柱子 并 不 难 ， 甚 至 会 说 太 简 单 。 这 看 上 去 就 是 本 例 的 基本 情况 。 

以 下 概述 如 何 借助 一 根 中 间 柱 子 ， 将 高 度 为 height 的 一 秋 盘 子 从 起 点 柱子 移 到 终点 柱子 : 


( 借助 终点 柱子 ， 将 高 度 为 height - 1 的 一 各 盘子 移 到 中 间 柱 子 ; 
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(2) 将 最 后 一 个 盘子 移 到 终点 柱子 ; 

G) 借助 起 点 柱子 ， 将 高 度 为 height - 1 的 一 天 盘子 从 中 间 柱 子 移 到 终点 柱子 。 

只 要 总 是 遵守 大 盘子 不 能 簿 在 小 盘子 之 上 的 规则 , 就 可 以 递归 地 执行 上 述 步 又， 就 像 最 下 面 
的 大 盘子 不 存在 一 样 。 上 述 步骤 仅 缺 少 对 基本 情况 的 判断 。 最 简单 的 汉 诺 塔 只 有 一 个 盘子 。 在 这 
种 情况 下 ， 只 需 将 这 个 盘子 移 到 终点 柱子 即 可 ,这 就 是 基本 情况 。 此 外 ， 上 述 步 又 通过 逐渐 减 小 
高 度 Height 来 向 基本 情况 靠近 。 代 码 清单 4-8 展示 了 解决 汉 诺 塔 问题 的 Python 代码。 


代码 清单 4-8 ”解决 汉 诺 塔 问题 的 Python 代码 


二 def moveTower (height, fromPole, toPole, withPole): 
分 if height >= 1: 

3 moveTower (height-1, fromPole, withPole, toPole) 
4 moveDisk (fromPole, toPole) 

5 moveTower (height-1, withPole, toPole, fromPole) 
























































代码 清单 4-8 几乎 和 用 英语 描述 一 样 。 算 法 如 此 简洁 的 关键 在 于 进行 两 个 递归 调用 ,分 别 在 
第 3 行 和 第 5 行 。 第 3 行将 除了 最 后 一 个 盘子 以 外 的 其 他 所 有 盘子 从 起 点 柱子 移 到 中 间 柱 子 。 第 
4 行 简单 地 将 最 后 一 个 盘子 移 到 终点 柱子 。 第 5 行将 之 前 的 塔 从 中 间 柱 子 移 到 终点 柱子 ， 并 将 其 
放置 在 最 大 的 盘子 之 上 。 基 本 情况 是 高 度 为 0。 此 时 ， 不 需要 做 任何 事情 ， 因 此 moveTower 也 
数 直 接 返回 。 这 样 处 理 基 本 情况 时 需要 记 住 ， 从 moveTower 返回 才能 调用 moveDi sk。 

moveDisk 函数 非常 简单 ， 如 代码 清单 4-9 所 示 。 它 所 做 的 就 是 打印 出 一 条 消息 ， 说 明 将 盘 
子 从 一 根 柱子 移 到 男 一 根 柱 子 。 不 妨 尝试 运行 moveTower 程序 ， 你 会 发 现 它 是 非常 高 效 的 解决 
方案 。 
代码 清单 4-9 moveDisk 函数 


4 def moveDisk (fp, tp): 
2 print ("moving disk from %d to %d\n" %$ (fp, tp)) 
























































看 完 moveTower 和 moveDisk 的 实现 代码 ,你 可 能 会 疑惑 为 什么 没有 一 个 数据 结构 显 式 地 
保存 柱子 的 状态 。 下 面 是 一 个 提示 : 若 要 显 式 地 保存 柱子 的 状态 ， 就 需要 用 到 3 个 stack 对 象 ， 
一 根 柱子 对 应 一 个 栈 。Python 通过 调用 栈 隐 式 地 提供 了 我 们 所 需 的 栈 ， 就 像 在 tostr 的 例子 中 
一 样 。 


4.6 探索 迷宫 


本 探讨 一 个 与 于 勃发 展 的 机 器 人 领域 相关 的 问题 : 走出 迷宫 。 如 果 你 有 一 个 Roomba 扫地 
机 需 人 ,或 许 能 利用 在 本 节 学 到 的 知识 对 它 进 行 重新 编程 。 我 们 要 解决 的 问题 是 帮助 小 乌龟 走出 
虚拟 的 迷宫 。 迷 宫 问 题 源 自 趟 修 斯 大 战 牛 头 怪 的 古 希 腊 神 话 传说 。 相 传 ， 在 迷宫 里 杀 死 牛头 怪 之 
后 ， 武 修 斯 用 一 个 线 团 找到 了 迷宫 的 出 口 。 本 节 假 设 小 乌龟 被 放置 在 迷宫 里 的 某 个 位 置 , 我 们 要 
做 的 是 帮助 它 怜 出 迷宫 ， 如 图 4-12 所 示 。 






















































































图 4-12 帮助 小 乌龟 仆 出 迷宫 
为 简单 起 见 ， 假 设 迷宫 被 分 成 许多 格 ， 每 一 格 要 么 是 空 的 ， 要 么 被 墙 堵 上 。 小 乌龟 只 能 沿 着 





空 的 格子 朴 行 ， 如 果 遇 到 墙 ， 就 必须 转变 方向 。 它 需要 如 下 的 系统 化 过 程 来 找到 出 路 。 
口 从 起 始 位 置 开 始 ， 首 先 向 北 移动 一 格 ， 然 后 在 新 的 位 置 再 递归 地 重复 本 过 程 。 
口 如 果 第 一 步 往 北 行 不 通 ， 就 尝试 向 南 移动 一 格 ， 然 后 递归 地 重复 本 过 程 。 
口 如 果 向 南 也 行 不 通 ， 就 尝试 向 西 移动 一 格 ， 然 后 递归 地 重复 本 过 程 。 
口 如 果 向 北 、 向 南 和 向 西 都 不 行 ， 就 尝试 向 东 移 动 一 格 ， 然 后 递归 地 重复 本 过 程 。 
口 如 果 4 个 方向 都 不 行 ， 就 意味 着 没有 出 路 。 

整个 过 程 看 上 去 非常 简单 , 但 是 有 许多 细节 需要 讨论 。 假设 递归 过 程 的 第 一 步 是 向 北 移动 一 
格 。 根 据 上 述 过 程 ， 下 一 步 也 是 向 北 移动 一 格 。 但 是 ， 如 果 北 面 有 墙 ， 必 须根 据 递归 过 程 的 第 二 
步 向 南 移动 一 格 。 不 幸 的 是 ， 向 南 移动 一 格 之 后 回 到 了 起 点 。 如 果 继 续 执行 该 递归 过 程 ， 就 会 又 
向 北 移动 一 格 ， 然 后 又 退回 来 ， 从 而 陷入 无 限 循环 中 。 所 以 ,必须 通过 一 个 策略 来 记 住 到 过 的 地 
方 。 本 例假 设 小 乌 色 一 边 候 , 一 边 丢 面包 悄 。 如 果 往 某 个 方向 走 一 格 之 后 发 现 有 面包 悄 ， 就 知道 
应 该 立刻 退回 去 ， 然 后 尝试 递归 过 程 的 下 一 步 。 查 看 这 个 算法 的 代码 时 会 发 现 ,退回 去 就 是 从 递 
归 函 数 调用 中 返回 。 

和 考察 其 他 递归 算法 时 一 样 , 让 我 们 来 看 看 上 述 算法 的 基本 情况 , 其 中 一 些 可 以 根据 之 前 的 
描述 猜 到 。 这 个 算法 需要 考虑 以 下 4 种 基本 情况 。 

() 小 乌龟 遇 到 了 墙 。 由 于 格子 被 墙 丧 上 ， 因 此 无 法 再 继续 探索 。 

CO) 小 乌龟 遇 到 了 已 经 走 过 的 格子 。 在 这 种 情况 下 ,我 们 不 希望 它 继续 探索 ,不 然 会 陷 人 循环 。 
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(3) 小 乌龟 找到 了 出 口 
(4) 四 个 方向 都 行 不 通 
为 了 使 程序 运行 起 来 , 需要 通过 一 种 方式 表示 迷宫 。 我们 使 用 turtle 模块 来 绘制 和 探索 迷 
， 以 增加 趣味 性 。 迷 富 对 象 提供 下 列 方法 ， 可 用 于 编写 搜索 算法 。 
口 init _ 读 和 人 一 个 代表 迷宫 的 数据 文件 ， 初 始 化 迷宫 的 内 部 表示 ， 并 且 找 到 小 乌龟 的 
起 始 位 置 。 
D arawMaze 在 屏幕 上 的 一 个 窗口 中 绘制 迷宫 。 
口 updatePosition 更 新 迷宫 的 内 部 表示 ， 并 且 修 改 小 乌龟 在 迷宫 中 的 位 置 。 
口 isExit 检查 小 乌龟 的 当前 位 置 是 否 为 迷宫 的 出 口 
除 此 之 外 ，Maze 类 还 重 载 了 索引 运算 符 [] ， 以 便 算法 访问 任 一 格 的 状态 。 
代码 清单 4-10 展示 了 搜索 函数 searchFrom 的 代码 。 该 函数 接受 3 个 参数 : 迷宫 对 象 、 起 


始 行 ， 以 及 起 始 列 。 由 于 该 函数 的 每 一 次 递归 调用 在 逻辑 上 都 是 重新 开始 搜索 的 ， 因此 定义 成 接 
受 3 个 参数 非常 消 重 要 。 


代码 清单 4-10 “迷宫 搜索 函数 searchFrom 
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lh def searchFrom(maze, startRow, startColumn): 

2 maze.updatePosition(startRow, startColumn) 

3 # 检查 基本 情况 

4 # 工 。 遇 到 墙 

5 if maze[startRow] [startColumn] == OBSTACLE : 

6 return False 

7 # 2. 遇 到 已 经 走 过 的 格子 

8 if maze[startRow] [startColumn] == TRIED: 

9 return False 

10 # 3. 找到 出 口 

11 if maze.isExit (startRow, startColumn): 
maze.updatePosition(startRow, startColumn, PART_OF_PATH) 
3 return True 

14 maze.updatePosition(startRow, startColumn, TRIED) 

15 

16 # 否则 ， 依 次 尝试 向 4 个 方向 移动 

1 found = searchFrom(maze, startRow-1, startColumn) or \ 
18 searchFrom(maze, startRow+l1l, startColumn) or \ 
19 searchFrom(maze, startRow, startColumn-1) or \ 
20 searchFrom(maze, startRow, startColumn+1) 

21 if founad : 

迪克 | maze.updatePosition(startRow, startColumn, PART_OF_PATH) 
23 else: 

ps maze.updatePosition(startRow, startColumn, DEAD_END) 
2 忆 return found 

















函数 做 的 第 一 件 事 就 是 调用 updatePosition (第 2 行 )。 这 样 做 是 为 了 对 算法 进行 可 视 
化 ， pe 乌 包 如 何在 迷宫 中 寻找 出 口 。 接 着 , 该 函数 检查 前 3 种 基本 情况 : 是 否 遇 到 
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了 墙 (第 5 行 )? 是 否 遇 到 了 已 经 走 过 的 格子 (第 8 行 )? 是 否 找 到 了 出 口 (第 11 行 )? 如 果 
没有 一 种 情况 符合 ， 则 继续 递归 搜索 。 

递归 搜索 调用 了 4 个 searchFrom。 很 难 预测 一 共 会 进行 多 少 个 递归 调用 , 这 是 因为 它们 都 
是 用 布尔 运算 符 or 连接 起 来 的 。 如 果 第 一 次 调用 searchFrom 后 返回 True， 那 么 就 不 必 进 行 
后 续 的 调用 。 可 以 这 样 理 解 : 向 北 移动 一 格 是 离开 迷宫 的 路 径 上 的 一 步 。 如 果 向 北 没有 能 够 走出 
迷宫 ， 那 么 就 会 尝试 下 一 个 递归 调用 ， 即 向 南 移动 。 如 果 向 南 失 败 了 ， 就 尝试 向 西 ， 最 后 向 东 。 
如 果 所 有 的 递归 调用 都 失败 了 ， 就 说 明 遇 到 了 死胡同 。 请 下 载 或 自己 输入 代码 , 改变 4 个 递归 调 
用 的 顺序 ， 看 看 结果 如 何 。 

Maze 类 的 方法 定义 如 代码 清单 4-11~ 代 码 清单 4-13 所 示 。__ init 方法 只 接受 一 个 参数 ， 


即 文件 名 。 其 中 + 代表 墙 ， 空 格 代表 空 的 格子 ，S 代表 起 始 位 置 。 
图 4-13 是 迷宫 数据 文件 的 例子 。 其 元 素 也 是 列表 。 实 例 变 量 


































































































mazelist 的 每 一 行 是 一 个 列表 ， ， 字符 。 对 于 图 4-13 对 应 的 数据 文件 , 其 内 
部 表示 如 下 。 
L :De Vo 
| pe gy yy 
[de a re Fl 
ER TA ge op pe a EY 
区 Es oe Es a) 
Ds ge BT i 
| me i a Ey yy te Dy 
[Sp Dp Dp Dap De hn Ua pe 人 
pn a A a 站 
| Et 
| Be RR DR We eh De ge eb] 


十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


+ + 十 二 十 十 十 十 十 
十 十 十 十 十 十 十 十 十 + 十 十 
十 十 十 “十 十 十 十 十 十 +++ 十 十 
十 ++ ++ + 
十 十 十 十 十 “十 十 十 十 十 十 十 二 十 十 十 十 
十 十 +++++++ 十 十 
十 “十 十 十 十 十 十 十 S + 十 
+ + 十 十 十 


十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


图 4-13 ”迷宫 数据 文件 示例 
drawMaze 方法 使 用 以 上 内 部 表示 在 屏幕 上 绘制 初始 的 迷宫 ， 如 图 4-12 所 示 。 


updatePosition 方法 使 用 相同 的 内 部 表示 检查 小 乌龟 是 否 遇 到 了 墙 。 同 时 , 它 会 更 改 内 部 
表示 ,使 用 .和 -来 分 别 表 示 小 乌龟 遇 到 了 走 过 的 格子 和 死胡同 。 此 外 ，upgdatePosition 方法 
还 使 用 辅助 函 数 moveTurtle 和 dropBreadcrumb 来 更 新 屏 幕 上 的 信息 。 


isExit 方法 检查 小 乌 包 的 当前 位 置 是 否 为 出 口 , 条 件 是 小 乌龟 已 经 疏 到 迷宫 边缘 : 第 0 行 、 
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第 0 列 、 最 后 一 行 或 者 最 后 一 列 。 


代码 清单 4-11 Maze 类 








1 class Maze: 

2 def _ init__(self, mazeFileName): 

3 rowsInMaze = 0 

4 columnsInMaze = 0 

5 self.mazelist = [] 

6 mazeFile = open(mazeFileName, 'r') 

让 rowsInMaze = 0 

8 for line in mazeFile: 

9 rowList = [] 

1.0 col=0 

并 二 ror eh Tn .J Tnes[ss 

王 儿 rowList.append (ch) 

3 a le Se 

14 self.startRow = rowsInMaze 

Ns self.startCol = col 

16 Gol 二 EOL 二 “1 

rowsInMaze = rowsInMaze + 1 

18 self.mazelist.append (rowList) 

19 columnsInMaze = len(rowList) 

20 

21 self.rowsInMaze = rowsInMaze 

22 self.columnsInMaze = columnsInMaze 

色光 self.xTranslate = -~columnsInMaze/2 

24 self.yTranslate = rowsInMaze/2 

5 self.t = Turtle(shape='turtle') 

26 setup (width=600, height=600) 

2 办 setworldcoordinates(-(columnsInMaze-1)/2-.5, 
28 (trowelrMaze-1) /2=4 5 
29 (columnsInMaze-1)/2+.5, 
30 (rowsInMaze-1)/2+.5) 





代码 清单 4-12 ”Maze 类 





1 def drawMaze (self): 

多 for y in range(self.rowsInMaze): 

3 for x in range(self.columnsIinMaze): 

4 if self.mazelistl[ly] [x] == OBSTACLE: 

5 self.drawCenteredBox (x+self.xTranslate, 
6 -y+self.yTranslate, 
7 "tarnm,y 

8 self.t.color('black', 'blue') 

9 

10 def drawCenteredBox(self, x, y, color): 

dl tracer (0) 

12 self.t.up() 

13 self.t.goto(x-.5, y—-.5) 

14 self.t.color('black', color) 

15 self.t.setheading(90) 

16 self.t.down() 
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二 了 self.t.begin fill() 

18 for i in range(4): 

四 了。 self.t.forward(1) 

20 self.t.right (90) 

21 self.t.engd_ fill() 

22 update() 

23 tracer (1) 

24 

过 导 def moveTurtle(self, x, y): 

26 self.t.up() 

2 self.t.setheading (self.t.towards (x+self.xTranslate, 
28 -y+self.yTranslate)) 
29 self.t.goto(x+self.xTranslate, -y+self.yTranslate) 
30 

31 def dropBreadcrumb (self, color): 

32 self.t.dot (color) 

33 

34 def updatePosition(self, row, col, val=None): 
3.5 if val: 

36 self.mazelist[row] [col] = val 

3 self.moveTurtle(col, row) 

38 

39 if val == PART_ OF_PATH: 

40 Color = 'green' 

入 于 elif val == OBSTACLE : 

42 color = 'red' 

43 elif val == TRIED: 

44 GOOLE Ee "DLIock: 

45 elif val == DEAD_END: 

46 color ='red' 

47 else: 

48 color = None 

49 

50 Tf -COLO 

SL self.dropBreadcrumb (color) 








代码 清单 4-13 ”Maze 类 





def _ getitem (self, idx): 
return self.mazelist[idx] 


Eh def isExit (self, row, col): 

2 芝 全 也 六 WS 0 多 让 

3 row == self.rowsIinMaze-1 or 
4 GO 二 = GE 

5 col == self.columnsInMaze-1) 
6 

中 

8 
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许多 计算 机 程序 被 用 于 优化 某 些 值 , 例如 找到 两 点 之 间 的 最 短路 径 ,为 一 组 数据 点 找到 最 佳 
拟 合 线 ， 或 者 找 到 满足 一 定 条 件 的 最 小 对 象 集合 。 计 算 机 科学 家 采用 很 多 策略 来 解决 这 些 问 题 。 
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本 书 的 一 个 目标 就 是 帮助 你 了 解 不 同 的 问题 解决 策略 ,在 解决 优化 问题 时 ,一 个 策略 是 动态 规划 。 

优化 问题 的 一 个 经 典 例子 就 是 在 找 零 时 使 用 最 少 的 硬币 。 假 设 菜 个 自动 售 货 机 制造 商 希 望 在 
每 笔 交 易 中 给 出 最 少 的 硬币 。 一 个 顾客 使 用 一 张 一 美 元 的 纸币 购买 了 价值 37 美 分 的 物品 ， 最 少 
需要 找 给 该 顾客 多 少 硬 币 呢 ? 答案 是 6 枚 : 25 美 分 的 2 枚 ，10 美 分 的 1 枚 ，! 美 分 的 3 枚 。 该 如 
何 计算 呢 ? 从 面值 最 大 的 硬币 〈25 美 分 ) 开始 ， 使 用 尽 可 能 多 的 硬币 ， 然 后 尽 可 能 多 地 使 用 面 
值 第 2 大 的 硬币 。 这 种 方法 叫 作 贪 梦 算 法 一 一 试图 最 大 程度 地 解决 问题 。 

对 于 美国 的 硬币 来 说 ， 贪 禁 算 法 很 有 效 。 不 过 ， 假 如 除了 常见 的 1 分 、5 分 、10 分 和 25 分， 
硬币 的 面值 还 有 21 分 , 那么 贪 焚 算 法 就 没 法 正确 地 为 找 零 63 分 的 情况 得 出 最 少 硬币 数 。 尽 管 多 
了 21 分 的 面值 ， 贪 禁 算 法 仍然 会 得 到 6 枚 硬币 的 结果 ， 而 最 优 解 是 3 枚 面值 为 21 分 的 硬币 。 

让 我 们 来 考察 一 种 必定 能 得 到 最 优 解 的 方法 。 由 于 本 章 的 主题 是 递归 , 因此 你 可 能 已 经 猜 到 ， 
这 是 一 种 递归 方法 。 首 先 确定 基本 情况 : 如 果 要 找 的 零钱 金额 与 硬币 的 面值 相同 ， 那 么 只 需 找 1 
枚 硬币 即 可 。 

如 果 要 找 的 零钱 金额 和 硬币 的 面值 不 同 ， 则 有 多 种 选择 : 1 枚 1 分 的 硬币 加 上 找 零 金额 减 去 
1 分 之 后 所 需 的 硬币 ; 1 枚 5 分 的 硬币 加 上 找 零 金额 减 去 5 分 之 后 所 需 的 硬币 ; 1 枚 10 分 的 便 币 
加 上 找 零 金 额 减 去 10 分 之 后 所 需 的 硬币 ;1 枚 25 分 的 硬币 加 上 找 零 金额 减 去 25 分 之 后 所 需 的 硬 
币 。 我 们 需要 从 中 找到 硬币 数 最 少 的 情况 ， 如 下 所 示 。 




























































































numCoins = min(1 + numCoins (originalamount - 1)， 
1 + numCoins (originalamount - 5)， 
1 + numCoins (originalamount - 10)， 
1 + numCoins (originalamount - 25)) 




















代码 清单 4-14 实现 了 上 述 算法 。 第 3 行 检查 是 否 为 基本 情况 : 尝试 使 用 1 枚 硬币 找 零 。 如 
果 没 有 一 个 硬币 面值 与 找 零 金额 相等 ， 就 对 每 一 个 小 于 找 零 金额 的 硬币 面值 进行 递归 调用 。 第 6 
行使 用 列表 循环 来 得 选 出 小 于 当前 找 零 金额 的 硬币 面值 。 第 7 行 的 递归 调用 将 找 零 金额 减 去 所 选 
的 硬币 面值 ， 并 将 所 需 的 硬币 数 加 1， 以 表示 使 用 了 1 枚 硬币 。 


代码 清单 4-14 ” 找 零 问题 的 递归 解决 方案 














1 def recMC (coinValueList, change): 

2 minCoins = change 

3 if change in coinValueList: 

4 return 1 

可 else: 

6 for i in [c for c in coinValueList if c <= change] : 
本 numCoins = 1 + recMC (coinValueList, change-i) 
8 if numCoins < minCoins: 

9 minCoins = numCoins 

10 return minCoins 

11 


2 YeEcMG( lL; S99: LO 2D 63 
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代码 清单 4-14 的 问题 是 ， 它 的 效率 非常 低 。 事 实 上 ， 针 对 找 零 金额 是 63 分 的 情况 ， 它 需要 
进行 67 716 925 次 递归 调用 才能 找到 最 优 解 。 图 4-14 有 助 于 理解 该 算法 的 严重 缺陷 。 针 对 找 零 
金额 是 26 分 的 情况 ， 该 算法 需要 进行 377 次 递归 调用 ， 图 中 仅 展示 了 其 中 的 一 小 部 分 。 



































图 4-14 递归 调用 树 
在 图 4-14 中 ， 每 一 个 节点 都 对 应 一 次 对 recmc 的 调用 ， 节 点 中 的 数字 表示 此 时 正在 计算 的 











找 零 金额 ， 箭头 旁 的 数字 表示 刚 使 用 的 硬币 面值 。 从 图 中 可 以 发 现 , 采用 不 同 的 面值 组 合 ,可 以 
到 达 任 一 节点 。 主 要 的 问题 是 重复 计算 量 太 大 。 举 例 来 说 ， 数 字 为 15 的 节点 出 现 了 3 次, 每 次 
都 会 进行 52 次 函数 调用 。 显 然 ， 该 算法 将 大 量 时 间 和 资源 浪费 在 了 重复 计算 已 有 的 结果 上 。 

减少 计算 量 的 关键 在 于 记 住 已 有 的 结果 。 简单 的 做 法 是 把 最 少 便 币 数 的 计算 结果 存储 在 一 张 
表 中 ,并 在 计算 新 的 最 少 便 币 数 之 前 ， 检 查 结果 是 否 已 在 表 中 。 如 果 是 ， 就 直接 使 用 结果 ， 而 不 
是 重新 计算 。 代 码 清 单 4-15 实现 了 添加 查询 表 之 后 的 算法 。 


代码 清单 4-15 ”添加 查询 表 之 后 的 找 零 算法 































































































1 def recDC (coinValueList, change, knownResults): 
2 minCoins = change 
3 if change in coinValueList: 
4 knownResults [change] = 1 
5 return 1 
6 elif knownResults[change] > 0: 
2 return knownResults[changel] 
8 else: 
9 for i in [c for c in coinValueList if c <= changel]: 
0 numCoins = 1 + recDC (coinValueList, change-i, 
于 knownResults) 
2 if numCoins < minCoins: 
3 minCoins = numCoins 
半 罗 knownResults[change] = minCoins 
5 return minCoins 
6 
7 
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注意 , 第 6 行 会 检查 查询 表 中 是 和 否 已 经 有 某 个 找 零 金额 对 应 的 最 少 硬币 数 。 如 果 没 有 ， 就 递 
归 地 计算 并 且 把 得 到 的 最 少 硬币 数 结果 存在 表 中 。 修 改 后 的 算法 将 计算 找 零 63 分 所 需 的 递归 调 
用 数 降低 到 221 次 ! 

尽管 代码 清单 4-15 实现 的 算法 能 得 到 正确 的 结果 , 但 是 它 不 太 正 规 。 如 果 查 看 knownResults 
表 , 会 发 现 其 中 有 一 些 空白 的 地 方 。 事实 上 ,我们 所 做 的 优化 并 不 是 动态 规划 ,而 是 通过 记忆 化 
(或 者 叫 作 缓存 ) 的 方法 来 优化 程序 的 性 能 。 

真正 的 动态 规划 算法 会 用 更 系统 化 的 方法 来 解决 问题 。 在 解决 找 零 问 题 时 , 动态 规划 算法 会 
从 1 分 找 零 开始 , 然后 系统 地 一 直 计 算 到 所 需 的 找 零 金 额 。 这 样 做 可 以 保证 在 每 一 步 都 已 经 知道 
任何 小 于 当前 值 的 找 零 金额 所 需 的 最 少 硬 币 数 。 

让 我 们 来 看 看 如 何 将 找 零 11 分 所 需 的 最 少 硬 币 数 填 人 查询 表 ， 图 4-15 展示 了 这 个 过 程 。 从 1 
分 开始 ， 只 需 找 1 枚 1 分 的 硬币 。 第 2 行 展 示 了 1 分 和 2 分 所 需 的 最 少 硬币 数 。 同 理 ，2 分 只 需 找 
2 枚 1 分 的 硬币 。 第 $ 行 开始 变 得 有 趣 起 来 ， 此 时 我 们 有 2 个 可 选 方案 : 要 么 找 5 枚 1 分 的 硬币 ， 
要 么 找 1 枚 $ 分 的 硬币 。 哪 个 方案 更 好 呢 ? 查 表 后 发 现 ，4 分 所 需 的 最 少 硬币 数 是 4， 再 加 上 1 枚 
1 分 的 硬币 就 得 到 5 分 ( 共 需 要 5 枚 硬币 ); 如 果 直 接 找 1 枚 5 分 的 硬币 ， 则 最 少 硬币 数 是 1。 由 于 
1 比 5 小 ， 因 此 我 们 把 1 存 人 表 中 。 接 着 来 看 11 分 的 情况 ， 我 们 有 3 个 可 选 方案 ， 如 图 4-16 所 示 。 

(1) 1 枚 1 分 的 硬币 加 上 找 10 分 零钱 (11-1 ) 最 少 需要 的 硬币 (1 枚 )。 

(2) 1 枚 5 分 的 硬币 加 上 找 6 分 零钱 (11-5 ) 最 少 需要 的 人 硬币 (2 枚 )。 

(3) 1 枚 10 分 的 硬币 加 上 找 1 分 零钱 (11-10 ) 最 少 需要 的 硬币 (1 枚 )。 

第 1 个 和 第 3 个 方案 均 可 得 到 最 优 解 ， 即 共 需 要 2 枚 硬币。 

找 零 金额 















































































































































图 4-15 ” 找 零 算法 所 用 的 查询 表 
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11-10 
图 4-16 找 零 11 分 时 的 3 个 可 选 方案 


找 零 问 题 的 动态 规划 解法 如 代码 清单 4-16 所 示 。dpMakechange 接受 3 个 参数 : 硬币 面值 
列表 、 找 零 金 额 ， 以 及 由 每 一 个 找 零 金额 所 需 的 最 少 硬 币 数 构成 的 列表 。 当 函数 运行 结束 时 ， 
minCoins 将 包含 找 零 金额 从 0 到 change 的 所 有 最 优 解 。 


代码 清单 4-16 ”用 动态 规划 算法 解决 找 零 问题 








1 def dpMakeChange (coinValueList, change, minCoins): 

for cents in range (change+l1): 

3 coinCount = cents 

4 for Jj in. [efor’ ec in coinvalueList if ce.<= centsl]: 
5 if minCoins[cents-j] + 1 < coinCount: 

6 CoinCount = minCoins[cents -j]+1 

7 minCoins[cents] = coinCount 

8 return minCoins [change] 




















注意 ， 尽 管 我 们 一 开始 使 用 递归 方法 来 解决 找 零 问 题 ， 但 是 apMakechange 并 不 是 递归 矣 
数 。 请 记 住 ， 能够 用 递归 方法 解决 问题 ,并 不 代表 递归 方法 是 最 好 或 最 高 效 的 方法 。 动 态 规 划 孙 
数 所 做 的 大 部 分 工作 是 从 第 4 行 开 始 的 循环 。 该 循环 针对 由 cents 指定 的 找 零 金额 考虑 所 有 可 
用 的 面值 。 和 找 零 11 分 的 例子 一 样 ， 我 们 把 最 少 硬币 数 记 录 在 mincoins 表 中 。 

尽管 找 零 算法 在 寻找 最 少 硬币 数 时 表现 出 色 , 但 是 由 于 没有 记录 所 用 的 硬币 ,因此 它 并 不 能 
帮助 我 们 进行 实际 的 找 零 工作 。 通 过 记录 mincoins 表 中 每 一 项 所 加 的 硬币 ， 可 以 轻松 扩展 
dpMakechange， 从 而 记录 所 用 的 硬币 。 如 果 知 道上 一 次 加 的 硬币 ， 便 可 以 减 去 其 面值 ， 从 而 找 
到 表 中 前 一 项 ， 并 通过 它 知晓 之 前 所 加 的 硬币 。 代 码 清单 4-17 展示 了 修改 后 的 apMakechange 
算法 ， 以 及 从 表 中 回溯 并 打印 所 用 硬币 的 printcoins 函数 。 


代码 清单 4-17 ”修改 后 的 动态 规划 解法 







































































EE def dpMakeChange (coinValueList, change, minCoins, coinsUsed): 
2 for cents in range (change+l1): 

3 coinCount = cents 

4 newCoin = 1 

§ for Jj in, TG for cc in coinvalueList ifc <= Centsl: 

6 if minCoins[cents-j] + 1 < coinCount: 

7 coinCount = minCoins[cents -j]+1 

8 newCoin = J 

9 minCoins[cents] = coinCount 


128 第 4 章 


递归 





co OUm 必 wm 用 口 





coinsUsed[cents] = newCoin 


return minCoins[change] 
def printCoins (coinsUsed, change): 
coin = change 
while coin > 0: 

thisCoin = coinsUsed[coin] 

print (thisCoin) 


CO .= COLN ~ thiscCoiti 





最 后 ， 来 看 看 动态 规划 算法 如 何 处 理 硬 币 面值 含 2 








1 分 的 情况 。 前 3 行 创建 要 使 用 的 硬币 列 


表 。 接 着 创建 用 来 存储 结果 的 列表 。coinsUsed 是 一 个 列表 ,其 中 是 用 于 找 零 的 硬币 .coincount 

















是 最 


的 位 置 63 处 开始 ， 打 印 出 2 





CE 
, 1, 10, 1, 1, 1, 


人 少 人 硬币 数 。 
SS EL 2 0 ly 5 
>>> coinsUsed = [0]*64 
SS GOLnCount sr OT*6A 
>>> dpMakeChange (cl, 63, coinCount, coinsUsed) 
3 
>>> printCoins (coinsUsed, 63) 
21 
21 
21 
>>> printCoins (coinsUsed, 52) 
0 
成 二 
a 
>>> coinsUsed 
El horde. > dy Br dy, da de chr TO Ly ey chi 
On le sl A an Se herd ee Le lo Dh Os 
#7 Os bs Or Ld sy D3 LO ly by :AO 
pe TOs Ly “LO ZE] 


注意 , 硬币 的 打印 结果 直接 取 自 coinsUsed。 第 一 次 调用 printCoins 时 , 从 coinsUsed 











1; 然后 计算 63-21=42， 接 着 查看 列表 的 第 42 个 元 素 。 这 一 次 ， 又 


























遇 到 了 21。 最 后 ,第 21 个 元 素 也 是 21。 由 此 ， 便 得 到 3 枚 21 分 的 硬币 。 


4.8 


题 。 


小 结 























本 章 探讨 了 递归 算法 的 一 些 例子 。 选 择 这 些 算 法 , 是 为 了 让 你 理解 递归 能 高 效 地 解决 何 种 问 





以 下 是 本 章 的 要 点 。 

口 所 有 递归 算法 都 必须 有 基本 情况 。 

口 递归 算法 必须 改变 其 状态 并 向 基本 情况 靠近 。 
口 递归 算法 必须 递归 地 调用 自己 。 

口 递归 在 某 些 情况 下 可 以 替代 循环 。 

口 递归 算法 往往 与 问题 的 形式 化 表达 相对 应 。 

















口 递归 并 非 总 是 最 佳 方案 。 有 时 ， 递 归 算法 比 其 他 算法 的 计算 复杂 度 更 高 。 
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4.9 关键 术语 


递归 


4.10 


1 . 


0 


递归 调用 ”动态 规划 分形 ”基本 情况 栈 帧 


讨论 题 
画 出 汉 诺 塔 问题 的 调用 栈 ( 假设 起 初 栈 中 有 3 个 盘子 )。 
根据 4.4 节 所 描述 的 规则 ， 在 纸 上 绘 制 出 谢 尔 平 斯 基 三 角形 。 


采用 动态 规划 算法 找 零 , 计算 找 零 33 美 分 所 需 的 最 少 硬币 数 (假设 除了 常见 的 面值 外 ， 
还 有 面值 为 8 美 分 的 硬币 )。 


编程 练习 

写 一 个 递归 函数 来 计算 数 的 阶乘 。 

写 一 个 递归 函数 来 反 转 列表 。 

采用 下 列 一 个 或 全 部 方法 修改 递归 树 程序 。 | 
口 修改 树枝 的 粗细 程度 ， 使 得 branchLen 越 小 ， 线 条 越 细 。 

口 修改 树枝 的 颜色 ， 使 得 当 branchLen 非常 小 时 ， 树 枝 看 上 去 像 叶子 。 

口 修改 小 乌龟 的 转向 角度 ， 使 得 每 一 个 分 支 的 角度 都 是 一 定 范围 内 的 随机 值 ， 例 如 使 

角度 取 值 范 围 是 15~45 度 。 运 行程 序 ， 查 看 绘制 结果 。 
口 递归 地 修改 branchLen， 使 其 减 去 一 定 范围 内 的 随机 值 ， 而 不 是 固定 值 。 


如 果实 现 上 述 所 有 改进 方法 ， 绘 制 出 的 树 将 十 分 真实 。 

找到 一 种 绘制 分 形 山 的 算法 。 提 示 : 可 以 使 用 三 角形 。 

写 一 个 递归 函数 来 计算 斐 波 那 契 数列 ， 并 对 比 递 归 函 数 与 循环 函数 的 性 能 。 
实现 汉 详 塔 问题 的 一 个 解决 方案 ， 使 用 3 个 栈 来 记录 盘子 的 位 置 。 
使 用 turtle 绘图 模块 写 一 个 递归 程序 ， 画 出 希 尔 伯 特 曲线 。 
使 用 turtle 绘图 模块 写 一 个 递归 程序 ， 画 出 科 赫 雪花 。 

写 一 个 程序 来 解决 这 样 一 个 问题 : 有 2 个 坛子 ,其 中 一 个 的 容量 是 4 加 仑 , 另 一 个 的 是 
3 加仑 。 坛 子 上 都 没有 刻度 线 。 可 以 用 水 泵 将 它们 装 满 水 。 如 何 使 4 加 仓 的 坛子 最 后 装 
有 2 加仑 的 水 ? 















































































































































.扩展 练习 9 中 的 程序 ， 将 坛子 的 容量 和 较 大 的 坛子 中 最 后 的 水 量 作 为 参数 。 
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11， 写 一 个 程序 来 解决 这 样 一 个 问题 3 只 羚羊 和 3 只 狮子 准备 乘 船 过 河 ， 河 边 有 一 艘 能 容 
纳 2 只 动物 的 小 船 。 但 是 , 如果 两 侧 河 岸上 的 狮子 数量 大 于 羚羊 数量 , 羚羊 就 会 被 吃 掉 。 
找到 运送 办 法 ,使 得 所 有 动物 都 能 安全 渡河 。 
12， 利 用 turtle 绘图 模块 修改 汉 诺 塔 程序 , 将 盘子 的 移动 过 程 可 视 化 。 提示 : 可 以 创建 多 
只 小 乌龟 ， 并 将 它们 的 形状 改 为 长 方形 。 
13， 帕 斯 卡 三 角形 由 数字 组 成 ， 其 中 的 数字 交错 摆 放 ， 使 得 : 
nl! 
A 
”rln—r)! 
这 是 计算 二 项 式 系数 的 等 式 。 在 帕斯卡 三 角形 中 ， 每 个 数 等 于 其 上 方 两 数 之 和 ， 如 下 
所 示 。 
1 
人 于 
让 ”2 人 
1 3 3 下 
1 4 6 4 1 
将 行 数 作为 参数 ， 写 一 个 输出 帕斯卡 三 角形 的 程序 。 
14， 假 设 一 个 计算 机 科学 家 兼 艺术 大 盗 冯 人 美术 馆 。 他 只 能 用 一 个 容量 为 不 磅 的 背包 来 装 
盗 取 的 艺术 品 , 并 且 他 对 每 一 件 艺术 品 的 价值 和 重量 了 如 指 掌 。 他 会 如 何 写 一 个 动态 规 
划 程 序 来 帮助 自己 最 大 程度 地 获 利 呢 ? 下 面 的 例子 可 以 帮助 你 思考 : 假设 背包 容量 是 
20 磅 ， 艺 术 品 为 5 件 。 
艺术 品 重量 价值 
1 2 3 
2 3 4 
3 4 8 
4 5 8 
5 9 10 
15. 请 尝试 解决 字符 串 编 辑 距 离 问 题 ， 它 在 很 多 研究 领域 中 非常 有 用 。 假 设 要 把 单词 








algorithm 转换 成 alligator。 对 于 每 一 个 字母 ， 可 以 用 5 个 单位 的 代价 将 其 从 一 个 单词 复 
制 到 男 一 个 ， 也 可 以 用 20 个 单位 的 代价 将 其 删除 或 插入 。 拼 写 检查 程序 利用 将 一 个 单 
词 转换 为 男 一 个 的 总 代价 来 提供 拼写 建议 。 请 设计 一 个 动态 规划 算法 , 给 出 任意 两 个 单 
词 之 间 的 最 小 编辑 距离 。 

















5.1 


搜索 和 排序 








本 章 目标 
口 能 够 解释 并 实现 顺序 搜索 和 二 分 搜索 。 











口 从 搜索 技巧 的 角度 理解 散 列 。 
口 掌握 映射 这 个 抽象 数据 类 型 。 
口 使 用 散 列 实现 映射 。 





5.2 搜索 


序 。 





本 章 重 点 探讨 搜索 和 排序 ， 它 们 是 最 常见 的 计算 机 科学 问题 。 本 节 探 讨 搜索 ，5.3 节 研 究 排 
搜索 是 指 从 元 素 集合 中 找到 某 个 特定 元 素 的 算法 过 程 。 搜 索 过 程 通常 返回 True 或 False， 
分 别 表示 元 素 是 否 存在 。 有 时 ， 可 以 修改 搜索 过 程 ， 使 其 返回 目标 元 素 的 位 置 。 不 过 ， 本 节 仅 考 














虑 元 素 是 否 存在 。 


Python 提供 了 运算 符 in， 通 过 它 可 以 方便 地 检查 元 素 是 否 在 列表 中 。 


| 
False 

SS 3 Tn 32 5 7125, yl Ly 
TEUS 

>>> 


尽管 写 起 来 很 方便 , 但 是 必须 经 过 一 个 深层 的 处 理 过 程 才 能 获得 结果 。 





hl 





很 多 种 ， 我 们 感 兴趣 的 是 这 些 算法 的 原理 及 其 性 能 差异 。 


5.2. 


1 顺序 搜索 





存储 于 列表 等 集合 中 的 数据 项 彼此 存在 线性 或 顺序 的 关系 , 每 个 数据 项 的 位 置 与 其 他 数据 项 
相关 。 在 Python 列表 中 ， 数 据 项 的 位 置 就 是 它 的 下 标 。 因 为 下 标 是 有 序 的， 所 以 能 




















由 此 可 以 进行 顺序 搜索 。 


口 能 够 解释 并 实现 冒 泡 排 序 、 选 择 排序 、 插 入 排序 、 希 尔 排 序 、 归 并 排序 和 快速 排序 。 


有 实 上 ,搜索 算法 有 
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表 中 。 


图 5-1 展示 了 顺序 搜索 的 原理 。 从 列表 中 的 第 一 个 元 素 开始 ， 沿 着 默认 的 顺序 逐个 查看 ， 
直到 找到 目标 元 素 或 者 查 完 列表 。 如 果 查 完 列表 后 仍 没有 找到 目标 元 素 , 则 说 明 目 标 元 素 不 在 列 

















图 5-1 在 整数 列表 中 进行 顺序 搜索 


顺序 搜索 算法 的 Python 实现 如 代码 清单 5-1 所 示 。 这 个 函数 接受 列表 与 目标 元 素 作为 参数 ， 

















并 返回 一 个 表示 目标 元 素 是 否 存在 的 布尔 值 。 布 尔 型 变量 foung 的 初始 值 为 False， 如 果 找 到 


目标 元 素 ， 就 将 它 的 值 改 为 True。 





代码 清单 5-1 无 序列 表 的 顺序 搜索 

1 def sequentialSearch(alist, item): 
此 ee /| 

3 found = False 

4 

5 while pos < len(alist) and not found: 
6 if alist[pos]l == item: 

yy found = True 

8 else: 

9 pos = pos +1 

10 

于 和 return found 





分 析 顺 序 搜索 算法 

















在 分 析 搜 索 算法 之 前 ,需要 定义 计算 的 基本 单元 ， 这 是 解决 此 类 问题 的 第 一 步 。 对 于 搜索 





来 说 , 统计 比较 次 数 是 有 意义 的 。 








次 比较 只 有 两 个 结果 : 要 么 找到 目标 元 素 , 要 么 没有 找到 。 











本 节 做 了 一 个 假设 ， 即 元 素 的 排列 是 无 序 的 。 也 就 是 说 ， 目 标 元 素 位 于 每 个 位 置 的 可 能 性 都 一 


样 大 。 








要 确定 目标 元 素 不 在 列表 中 , 唯 











的 方法 就 是 将 它 与 列表 中 的 每 个 元 素 都 比较 一 次 。 如 果 列 


























表 中 有 个 元 素 , 那么 顺序 搜索 要 经 过 nn 次 比较 后 才能 确定 目标 元 素 不 在 列表 中 。 如 果 列 表 包 含 
目标 元 素 ,分析 起 来 更 复杂 。 实际 上 有 3 种 可 能 情况 , 最 好 情况 是 目标 元 素 位 于 列表 的 第 一 个 位 
置 ， 即 只 需 比较 一 次 ; 最 坏 情况 是 目标 元 素 位 于 最 后 一 个 位 置 ， 即 需要 比较 n 次 。 























普通 情况 又 如 何 呢 ? 我 们 会 在 列表 的 中 间 位 置 处 找到 目标 元 素 ， 即 需要 比较 次 。 当 nn 变 大 
时 ,系数 会 变 得 无 足 轻重 , 所 以 顺序 搜索 算法 的 时 间 复 杂 度 是 O(n) 。 表 5-1 总 结 了 3 种 可 能 情况 


的 比较 次 数 。 
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表 5-1 在 无 序列 表 中 进行 顺序 搜索 时 的 比较 次 数 




















最 好 情况 最 坏 情 况 普通 情况 
存在 目标 元 素 1 n 5 
不 存在 目标 元 素 n n n 




















前 面 假设 列表 中 的 元 素 是 无 序 排列 的 ， 相互 之 间 没 有 关联 。 如 果 元 素 有 序 排列 ,顺序 搜索 算 
法 的 效率 会 提高 吗 ? 

假设 列表 中 的 元 素 按 升序 排列 。 如 果 存 在 目标 元 素 , 那么 它 出 现在 个 位 置 中 任意 一 个 位 置 
的 可 能 性 仍然 一 样 大 ,因此 比较 次 数 与 在 无 序列 表 中 相同 。 不 过 ， 如 果 不 存在 目标 元 素 , 那么 搜 
索 效率 就 会 提高 。 图 5-2 展示 了 算法 搜索 目标 元 素 50 的 过 程 。 注 意 ， 顺 序 搜索 算法 一 路 比较 列 
表 中 的 元 素 ， 直 到 遇 到 54。 该 元 素 列 含 额 外 的 信息 : 54 不 仅 不 是 目标 元 素 ， 而 且 其 后 的 元 素 也 
都 不 是 ， 这 是 因为 列表 是 有 序 的 。 因 此 ， 算 法 不 需要 搜 完整 个 列表 ， 比 较 完 54 之 后 便 可 以 立即 
停止 。 代 码 清单 5-2 展示 了 有 序列 表 的 顺序 搜索 函数 。 
























































图 5-2 在 有 序 整数 列表 中 进行 顺序 搜索 














代码 清单 5-2 有 序列 表 的 顺序 搜索 








1 def orderedSequentialSearch(alist, item): 
2 者 

3 found = False 

4 stop = False 

5 while pos < len(alist) and not found and not stop: 
6 if alist[pos] == item: 

7 found “= "TEUS 

8 else: 

9 if alist[pos] > item: 

1 stop = True 

图 else: 

2 pos = pos +1 

be 

14 return found 














表 5-2 总 结 了 在 有 序列 表 中 顺序 搜索 时 的 比较 次 数 。 在 最 好 情况 下 ， 只 需 比 较 一 次 就 能 知道 
目标 元 素 不 在 列表 中 。 普 通 情 况 下 ， 需 要 比较 次， 不 过 算法 的 时 间 复 杂 度 仍 是 O(n) 。 总 之 ， 
只 有 当 列 表 中 不 存在 目标 元 素 时 ， 有 序 排列 元 素 才 会 提高 顺序 搜索 的 效率 。 
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表 5-2 在 有 序列 表 中 进行 顺序 搜索 时 的 比较 次 数 








最 好 情况 最 坏 情况 普通 情况 
存在 目标 元 素 1 n > 
不 存在 目标 元 素 1 n 


5.2.2 ”二 分 搜索 


如 果 在 比较 时 更 聪明 些 , 还 能 进一步 利用 列表 有 序 这 个 有 利 条 件 。 在 顺序 搜索 时 ， 如果 第 一 
个 元 素 不 是 目标 元 素 , 最 多 还 要 比较 n-1 次 。 但 二 分 搜索 不 是 从 第 一 个 元 素 开始 搜索 列表 ， 而 是 
从 中 间 的 元 素 着 手 。 如 果 这 个 元 素 就 是 目标 元 素 ， 那 就 立即 停止 搜索 ;如果 不 是 ， 则 可 以 利用 列 
表 有 序 的 特性 ,排除 一 半 的 元 素 。 如 果 目 标 元素 比 中 间 的 元 素 大 ， 就 可 以 直接 排除 列表 的 左 半 部 
分 和 中 间 的 元 素 。 这 是 因为 ， 如 果 列 表 包 含 目标 元 素 ， 它 必定 位 于 右 半 部 分 。 

接 下 来 ， 针 对 右 半 部 分 重复 二 分 过 程 。 从 中 间 的 元 素 着 手 ， 将 其 和 目标 元 素 比 较 。 同 理 ， 要 
么 直接 找到 目标 元 素 ， 要么 将 右 半 部 分 一 分 为 二 ， 再 次 缩小 搜索 范围 。 图 5-3 展示 了 二 分 搜索 算 
法 如 何 快速 地 找到 元 素 54， 完 整 的 函数 如 代码 清单 5-3 所 示 。 












































开始 
图 5-3 在 有 序 整 数列 表 中 进行 二 分 搜索 








代码 清单 5-3 ”有 序列 表 的 二 分 搜索 





1 def binarySearch(alist, item): 

2 eh | 

3 last = len(alist) - 1 

4 found = False 

6 while first <= last angd not founad : 
人 midpoint = (first + last) // 2 
8 if alist[midpoint] == item: 

9 found = True 

10 else: 

二 再 if item < alist[midpoint]: 
十 汉 last = midpoint - 1 

二 3 else: 

14 first = midpoint + 1 


16 return found 
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请 注意 ,这 个 算法 是 分 治 策略 的 好 例子 。 分 治 是 指 将 问题 分 解 成 小 问题 ,以 某 种 方式 解决 小 
问题 ,然后 整合 结果 ， 以 解决 最 初 的 问题 。 对 列表 进行 二 分 搜索 时 ， 先 查看 中 间 的 元 素 。 如 果 目 
标 元 素 小 于 中 间 的 元 素 ， 就 只 需要 对 列表 的 左 半 部 分 进行 二 分 搜索 。 同 理 ， 如 果 目 标 元 素 更 大 ， 
则 只 需 对 右 半 部 分 进行 二 分 搜索 。 两 种 情况 下 , 都 是 针对 一 个 更 小 的 列表 递归 调用 二 分 搜索 函数 ， 
如 代码 清单 5-4 所 示 。 














代码 清单 5-4 ”二 分 搜索 的 递归 版 本 

a def pbinarySearch(alist, item): 

人 2 if len(alist) == 

3 return False 

4 else: 

5 midpoint = len(alist) // 2 

6 if alist[midpoint] == item: 

7 return True 

8 else: 

9 if item < alist[midpoint]: 

10 return binarySearch(alist[:midpoint], item) 
EE else: 

12 return binarySearch(alist[midpoint+1:], item) 





分 析 二 分 搜索 算法 
在 进行 二 分 搜索 时 ， 每 一 次 比较 都 将 待考 虑 的 元 素 减 半 。 那 么 ， 要 检查 完整 个 列表 ， 二 分 搜 
索 算 法 最 多 要 比较 多 少 次 呢 ? 假设 列表 共有 ?个 元 素 ， 第 一 次 比较 后 剩 下 个 元 素 ， 第 2 次 比较 
































后 简 下 二 个 元 素 , 接 下 来 是 ,然后 是 ， 依 此 类 推 。 列表 能 分 多 少 次 呢 ? 表 5-3 给 出 了 答案 。 
表 5-3 二 分 搜索 算法 的 表格 分 析 
比较 次 数 剩余 元 素 的 近似 个 数 
1 到 
之 
2 思 
4 
3 2 
8 
5 
1? ER 
7 

















拆 分 足够 多 次 后 ,会 得 到 只 含 一 个 元 素 的 列表 。 这 个 元 素 要 么 就 是 目标 元 素 , 要 么 不 是 。 无 
论 是 哪 种 情况 ,计算 工作 都 已 完成 。 要 走 到 这 一 步 , 需 要 比较 ?次 ,其 中 =1。 由 此 可 得 ,i= logn 。 
比较 次 数 的 最 大 值 与 列表 的 元 素 个 数 是 对 数 关 系 。 所 以 , 二 分 搜索 算法 的 时 间 复 杂 度 是 O(logn) 。 
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还 有 一 点 要 注意 ,在 代码 清单 5-4 中 ,递归 调用 binarySearch(alist[:miaqpoint]，item) 
使 用 切片 运算 符 得 到 列表 的 左 半 部 分 ， 并 将 其 传 给 下 一 次 调用 ( 右 半 部 分 类 似 )。 前 面 的 分 析 假 
设 切片 操作 所 需 的 时 间 固 定 ， 但 实际 上 在 Python 中 ,切片 操作 的 时 间 复 杂 度 是 O(k) 。 这 意味 着 
若 采用 切片 操作 , 那么 二 分 搜索 算法 的 时 间 复 杂 度 不 是 严格 的 对 数 阶 。 所 幸 ,， 通 过 在 传人 列表 时 
带 上 头 和 尾 的 下 标 ， 可 以 弥补 这 一 点 。 作 为 练习 ， 请 参考 代码 清单 5-3 计算 下 标 。 

尽管 二 分 搜索 通常 优 于 顺序 搜索 , 但 当 n 较 小 时 ,排序 引起 的 额外 开销 可 能 并 不 划算 。 实 际 
上 应 该 始终 考虑 ,为 了 提高 搜索 效率 ,额外 排序 是 否 值得 。 如 果 排 序 一 次 后 能 够 搜索 多 次 ， 那么 
排序 的 开销 不 值 一 提 。 然 而 ， 对 于 大 型 列表 而 言 ， 只 排序 一 次 也 会 有 昂贵 的 计算 成 本 ， 因 此 从 头 
进行 顺序 搜索 可 能 是 更 好 的 选择 。 




















5.2.3 ” 散 列 


我 们 已 经 利用 元 素 在 集合 中 的 位 置 完善 了 搜索 算法 。 举 例 来 说 ， 针 对 有 序列 表 ,， 可 以 采用 二 
分 搜索 (时 间 复 杂 度 为 对 数 阶 ) 找到 目标 元 素 。 本 节 将 尝试 更 进一步 ， 通 过 散 列 构建 一 个 时 间 复 
杂 度 为 00) 的 数据 结构 。 

要 做 到 这 一 点 ， 需 要 了 解 更 多 关于 元 素 位 置 的 信息 。 如 果 每 个 元 素 都 在 它 该 在 的 位 置 上 , 那 
么 搜索 算法 只 需 比 较 一 次 即 可 。 不 过 ， 我 们 在 后 面 会 发 现 ， 事 实 往往 并 非 如 此 。 

散 列 表 是 元 素 集合 , 其 中 的 元 素 以 一 种 便于 查找 的 方式 存储 。 散 列表 中 的 每 个 位 置 通常 被 称 
为 模 ， 其 中 可 以 存储 一 个 元 素 。 模 用 一 个 从 0 开始 的 整数 标记 ,例如 0 号 柳 、1 号 槽 、2 号 槽 ， 
等 等 。 初始 情形 下 ， 散 列表 中 没有 元 素 , 每 个 槽 都 是 空 的 。 可 以 用 列表 来 实现 散 列 表 ， 并 将 每 个 
元 素 都 初始 化 为 Python 中 的 特殊 值 None。 图 5-4 展示 了 大 小 m 为 11 的 散 列表 。 也 就 是 说 ， 表 
中 有 m 个 槽 ， 编 号 从 0 到 10。 






















































































图 5-4 有 11 个 槽 的 散 列表 


散 列 函数 将 散 列表 中 的 元 素 与 其 所 属 位 置 对 应 起 来 。 对 散 列表 中 的 任 一 元 素 , 散 列 函 数 返回 
一 个 介 于 0 和 m 一 1 之 间 的 整数 。 假 设 有 一 个 由 整数 元 素 54、26、93、17、77 和 31 构成 的 集 
合 。 首 先 来 看 第 一 个 散 列 函 数 ， 它 有 时 被 称 作 “ 取 余 函 数 ”"， 即 用 一 个 元 素 除 以 表 的 大 小 ， 并 将 
得 到 的 余数 作为 散 列 值 (h (item) = item%11 )。 表 5-4 给 出 了 所 有 示例 元 素 的 散 列 值 。 取 余 函 
数 是 一 个 很 常见 的 散 列 冰 数 ， 这 是 因为 结果 必须 在 槽 编号 范围 内 。 























表 5-4 使 用 余数 作为 散 列 值 





元 素 散 列 值 
54 10 
26 4 
93 5 
17 6 
77 0 
31 9 


计算 出 散 列 值 后 ， 就 可 以 将 每 个 元 素 搬入 到 相应 的 位 置 ， 如 图 5-5 所 示 。 注 意 , 在 11 个 覃 
中 ， 有 6 个 被 占用 了 。 占 用 率 被 称 作 载荷 因子 ， 记 作 4 ， 定 义 如 下 。 


1 元素 个 数 
区 列表 天 小 














在 本 例 中 ， 站 


0 1 2 3 4 5 6 也 8 9 10 


图 5-5 有 6 个 元 素 的 散 列表 


搜索 目标 元 素 时 ， 仅 需 使 用 散 列 函 数 计算 出 该 元 素 的 槽 编号 ， 并 查看 对 应 的 槽 中 是 否 有 值 。 5 
因为 计算 散 列 值 并 找到 相应 位 置 所 需 的 时 间 是 固定 的 , 所 以 搜索 操作 的 时 间 复杂 度 是 OU 。 如果 
一 切 正常 ， 那 么 我 们 就 已 经 找到 了 常数 阶 的 搜索 算法 。 
可 能 你 已 经 看 出 来 了 ,只 有 当 每 个 元 素 的 散 列 值 不 同时 ， 这 个 技巧 才 有 用 。 如 果 集 合 中 的 下 
一 个 元 素 是 44， 它 的 散 列 值 是 0 (44%11==0 )， 而 77 的 散 列 值 也 是 0， 这 就 有 问题 了 。 散 列 函 
数 会 将 两 个 元 素 都 放 入 同一 个 槽 ， 这 种 情况 被 称 作 冲突 ， 也 叫 “ 磁 撞 ”。 显 然 ， 冲 突 给 散 列 函 数 
带 来 了 问题 ， 我 们 稍 后 详细 讨论 。 
1. 散 列 函数 
给 定 一 个 元 素 集合 ,能 将 每 个 元 素 映射 到 不 同 的 槽 这 种 散 列 函 数 称 作 完美 散 列 函 数 。 如 果 
元 素 已 知 , 并 且 集合 不 变 , 那么 构建 完美 散 列 函 数 是 可 能 的 。 不 幸 的 是 , 给 定 任意 一 个 元 素 集合 ， 
没有 系统 化 方法 来 保证 散 列 函 数 是 完美 的 。 所 幸 ， 不 完美 的 散 列 函数 也 能 有 不 错 的 性 能 。 
构建 完美 散 列 函 数 的 一 个 方法 是 增 大 散 列表 , 使 之 能 容纳 每 一 个 元 素 , 这 样 就 能 保证 每 个 元 
素 都 有 属于 自己 的 槽 。 当 元 素 个 数 少时 ， 这 个 方法 是 可 行 的 ， 不 过 当 元 素 很 多 时 ， 就 不 可 行 了 。 
如 果 元 素 是 9 位 的 社会 保障 号 ， 这 个 方法 需要 大 约 10 亿 个 槽 。 如果 只 想 存储 一 个 班 上 25 名 学 生 
的 数据 ， 这 样 做 就 会 浪费 极 大 的 内 存 空间 。 
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我 们 的 目标 是 创建 这 样 一 个 散 列 函数 : 冲突 数 最 少 ， 计 算 方 便 ， 元 素 均匀 分 布 于 散 列 表 中 。 
有 多 种 常见 的 方法 来 扩展 取 余 函数 ， 下 面 介绍 其 中 的 几 种 。 

折 又 法 先 将 元 素 切 成 等 长 的 部 分 ( 最 后 一 部 分 的 长 度 可 能 不 同 )， 然 后 将 这 些 部 分 相 加 ， 得 到 
散 列 值 。 假 设 元 素 是 电话 号 码 436-555-4601， 以 2 位 为 一 组 进行 切 分 ， 得 到 43、65、55、46 和 
01。 将 这 些 数字 相 加 后 , 得 到 210。 假设 散 列表 有 11 个 槽 , 接着 需要 用 210 除 以 11, 并 保留 余数 1。 
所 以 ， 电 话 号 码 436-555-4601 被 映射 到 散 列 表 中 的 1 号 烛 。 有 些 折 县 法 更 进一步 ， 在 加 总 前 每 
隔 一 个 数 反 转 一 次 。 就 本 例 而 言 ， 反 转 后 的 结果 是 : 43+56+55+64+01=219，219%11=10。 


男 一 个 构建 散 列 函 数 的 数学 技巧 是 平方 取 中 法 : 先 将 元 素 取 平方 ,然后 提取 中 间 几 位 数 。 如 
果 元 素 是 44, 先 计算 44=1936, 然后 提取 中 间 两 位 93 ， 继 续 进 行 取 余 的 步骤, 得 到 5 ( 93%11 )。 
表 5-5 分 别 展示 了 取 余 法 和 平方 取 中 法 的 结果 ， 请 确保 自己 理解 这 些 值 的 计算 方法 。 


表 5-5 取 余 法 和 平方 取 中 法 的 对 比 






















































































元 素 取 余 平方 取 中 
54 10 3 
26 4 7 
93 5 9 
17 6 8 
77 0 4 
31 9 6 


我 们 也 可 以 为 基于 字符 的 元 素 ( 比如 字符 串 ) 创建 散 列 函 数 。 可 以 将 单词 “cat” 看 作 序 数值 
序列 ， 如 下 所 示 。 


SS Ordtreo.y 
99 
ww FI( 
97 
SS OrFc( SLE) 
116 


因此 ， 可 以 将 这 些 序数 值 相 加 ， 并 采用 取 余 法 得 到 散 列 值 ， 如 图 5-6 所 示 。 代 码 清 单 5-5 给 
出 了 hasn 函数 的 定义 ,传人 一 个 字符 串 和 散 列 表 的 大 小 ， 该 函数 会 返回 散 列 值 ， 其 取 值 范围 是 
0 到 tablesize-1。 








C 


EF- 
二 


99 + 97 + 116 3 312 


312 % 11 一 4 
图 5-6 ”利用 序数 值 计算 字符 串 的 散 列 值 
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代码 清单 5-5 ”为 字符 串 构 建 简单 的 散 列 函 数 





1 def hash(astring, tablesize): 

2 sum = 0 

3 for pos in range(len(astring)): 

4 sum = sum + ordl(astring[pos]) 
- 
6 


return sum%tablesize 











有 趣 的 是 ,针对 异 序 词 ， 这 个 散 列 函 数 总 是 得 到 相同 的 散 列 值 。 要 弥补 这 一 点 ,可 以 用 字符 
位 置 作为 权重 因子 ， 如 图 5-7 所 示 。 作 为 练习 ， 请 修改 hash 函数 ， 为 字符 添加 权重 值 。 
位 置 
1 9 3 
Cc a t 
99*] + 97*2 + 116*3 = 641 


64] % 1 o>3 


图 5-7 在 考虑 权重 的 同时 ， 利 用 序数 值 计 算 字 符 串 的 散 列 值 


你 也 许 能 想到 多 种 计算 散 列 值 的 其 他 方法 。 重 要 的 是 , 散 列 函数 一 定 要 高 效 ， 以 免 它 成 为 存 
储 和 搜索 过 程 的 负担 。 如 果 散 列 函 数 过 于 复杂 , 计算 槽 编号 的 工作 量 可 能 比 在 进行 顺序 搜索 或 二 
分 搜索 时 的 更 大 ， 这 可 不 是 散 列 的 初衷 。 

2. 处 理 冲 突 

现在 回 过 头 来 解决 冲突 问题 。 当 两 个 元 素 被 分 到 同一 个 槽 中 时 ,必须 通过 一 种 系统 化 方法 在 
散 列表 中 安置 第 二 个 元 素 。 这 个 过 程 被 称 为 处 理 冲 突 。 前 文 说 过 ， 如 果 散 列 函 数 是 完美 的 ， 冲 突 
就 永远 不 会 发 生 。 然 而 ， 这 个 前 提 往 往 不 成 立 ， 因 此 处 理 冲 突 是 散 列 计算 的 重点 。 

一 种 方法 是 在 散 列 表 中 找到 另 一 个 空 模 , 用 于 放置 引起 冲突 的 元 素 。 简单 的 做 法 是 从 起 初 的 
散 列 值 开始 ,顺序 遍历 散 列 表 ， 直 到 找到 一 个 空 模 。 注 意 , 为 了 遍历 散 列 表 ， 可 能 需要 往 回 检查 
第 一 个 模 。 这 个 过 程 被 称 为 开放 定 址 法 , 它 尝 试 在 散 列 表 中 寻找 下 一 个 空 柳 或 地 址 。 由 于 是 逐个 
访问 槽 ， 因 此 这 个 做 法 被 称 作 线 性 探测 。 

现在 扩展 表 5-4 中 的 元 素 ， 得 到 新 的 整数 集合 (54, 26, 93, 17, 77, 31, 44, 55, 20 )， 图 5-8 展示 
了 新 整数 集合 经 过 取 余 散 列 函数 处 理 后 的 结果 。 请 回顾 图 5-5 所 示 的 初始 内 容 。 当 我 们 尝试 把 44 
放 和 人 0 号 槽 时 ， 就 会 产生 冲突 。 采 用 线性 探测 ， 依 次 检查 每 个 梭 ， 直 到 找到 一 个 空 槽 ， 在 本 例 中 
即 为 1 号 模 。 
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0 1 2 3 4 5 6 


7 8 9 10 


图 5-8 ”采用 线性 探测 处 理 冲 突 


同 理 ，55 应 该 被 放 入 0 号 柳 ， 但 是 为 了 避免 冲突 ， 必 须 被 放 入 2 号 槽 。 集 合 中 的 最 后 一 个 
元 素 是 20， 它 的 散 列 值 对 应 9 号 槽 。 因 为 9 号 模 中 已 有 元 素 ， 所 以 开始 线性 探测 ， 依 次 访问 10 
号 槽 、0 号 槽 、1 号 槽 和 2 号 槽 ， 最 后 找到 空 的 3 号 槽 。 

一 旦 利用 开放 定 址 法 和 线性 探测 构建 出 散 列表 ，, 即 可 使 用 同样 的 方法 来 搜索 元 素 。 假设 要 查 
找 元 素 93, 它 的 散 列 值 是 5。 查 看 5 号 槽 ， 发 现 槽 中 的 元 素 就 是 93， 因 此 返回 True。 如 果 要 查 
找 的 是 20， 又 会 如 何 呢 ? 20 的 散 列 值 是 9， 而 9 号 槽 中 的 元 素 是 31。 因 为 可 能 有 冲突 ， 所 以 不 
能 直接 返回 false， 而 是 应 该 从 10 号 槽 开始 进行 顺序 搜索 ， 直 到 找到 元 素 20 或 者 遇 到 空 槽 。 

线性 探测 有 个 缺点 ， 那 就 是 会 使 散 列 表 中 的 元 素 出 现 聚 集 现象 。 也 就 是 说 ， 如 果 一 个 槽 发 生 
太 多 冲突 , 线性 探测 会 填 满 其 附近 的 槽 ， 而 这 会 影响 到 后 续 插 人 的 元 素 。 在 尝试 搬入 元 素 20 时 ， 
要 越过 数 个 散 列 值 为 0 的 元 素 才能 找到 一 个 空 模 。 图 5-9 展示 了 这 种 聚集 现象 。 


0 1 多 3 4 a 6 7 8 9 10 
EE 
图 5-9 ” 散 列 值 为 0 的 元 素 聚 集 在 一 起 

要 避免 元 素 聚集 , 一 种 方法 是 扩展 线性 探测 ,不 再 依次 顺序 查找 空 模 ， 而 是 跳 过 一 些 模 ， 这 
样 做 能 使 引起 冲突 的 元 素 分 布 得 更 均匀 。 图 5-10 展示 了 采用 “加 3” 探测 策略 处 理 冲突 后 的 元 素 
分 布 情况 。 发 生 冲 突 时 ， 为 了 找到 空 模 ， 该 策略 每 次 跳 两 个 槽 。 


0 1 2 3 4 5 6 8 9 10 


图 5-10 采用 “加 3” 探 测 策 略 处 理 冲突 
再 散 列 泛 指 在 发 生 冲 突 后 寻找 男 一 个 权 的 过 程 。 采 用 线性 探测 时 ， 再 散 列 函数 是 


newhashvalue = rehash (oldhashvalue), 并 且 rehash(pos) = (pos +1)gsizeofttableo 
“加 3” 探测 策略 的 再 散 列 函数 可 以 定义 为 rehash(pos) = (pos + 3)%sizeoftable。 也 就 
是 说 ， 可 以 将 再 散 列 函数 定义 为 rehash(pos) = (pos + skip)%sizeoftable。 注 意 ,“ 跨 
步 ”( skip ) 的 大 小 要 能 保证 表 中 所 有 的 槽 最 终 都 被 访问 到 ， 否 则 就 会 浪费 醒 资 源 。 要 保证 这 一 
点 ， 常 常 建议 散 列 表 的 大 小 为 素数 ， 这 就 是 本 例 选用 11 的 原因 。 
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平方 探测 是 线性 探测 的 一 个 变 体 , 它 不 采用 固定 的 跨 步 大 小 , 而 是 通过 再 散 列 函数 递增 散 列 
值 。 如 果 第 一 个 散 列 值 是 4， 后 续 的 散 列 值 就 是 ht+l1、h+4、h+9、h+16， 等 等 。 换 句 话 说 , 平方 
探测 的 跨 步 大 小 是 一 系列 完全 平方 数 。 图 5-11 展示 了 采用 平方 探测 处 理 后 的 结果 。 





























图 5-11 采用 平方 探测 处 理 冲突 




















男 一 种 处 理 冲突 的 方法 是 让 每 个 权 有 一 个 指向 元 素 集 合 ( 或 链表 ) 的 引用 。 链 接 法 允许 散 列 
表 中 的 同一 个 位 置 上 存在 多 个 元 素 。 发 生 冲突 时 ， 元 素 仍然 被 插入 其 散 列 值 对 应 的 槽 中 。 不 过 ， 
随 着 同一 个 位 置 上 的 元 素 越 来 越 多 ,搜索 变 得 越 来 越 困难 。 图 5-12 展示 了 采用 链接 法 解决 冲突 
后 的 结果 。 


0 1 和 2 3 二 3 6 7 8 9 10 

















图 5-12 采用 链接 法 处 理 冲 突 





搜索 目标 元 素 时 ,我 们 用 散 列 函数 算出 它 对 应 的 槽 编号 。 由 于 每 个 槽 都 有 一 个 元 素 集合 ， 
此 需要 再 搜索 一 次 ,才能 得 知 目标 元 素 是 否 存在 。 链 接 法 的 优点 是 ,平均 算 来 ， 每 个 槽 的 元 素 不 
多 ， 因 此 搜索 可 能 更 高 效 。 本 节 最 后 会 分 析 散 列 算法 的 性 能 。 


3. 实现 映射 抽象 数据 类 型 


字典 是 最 有 用 的 Python 集合 之 一 。 第 1 章 说 过 ,字典 是 存储 键 - 值 对 的 数据 类 型 。 刍 用 来 查 
找 关 联 的 值 ， 这 个 概念 常常 被 称 作 映射 。 


映射 抽象 数据 类 型 定义 如 下 。 它 是 将 键 和 值 关联 起 来 的 无 序 集合 ,其 中 的 键 是 不 重复 的 ， 键 
和 值 之 间 是 一 一 对 应 的 关系 。 有 映射 支 持 以 下 操作 。 


口 Map () 创建 一 个 空 的 映射 ， 它 返回 一 个 空 的 映射 集合 。 
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口 get (key) 返 回 key 对 应 的 值 。 如 果 key 不 存在 ， 则 返回 None。 
D del 通过 del map [key] 这 样 的 语句 从 映射 中 删除 键 - 值 对 。 
D len() 返 回 映射 中 存储 的 键 - 值 对 的 数目 。 





















































口 put (key, val) 往 映射 中 加 入 一 个 新 的 键 - 值 对 。 如 果 键 已 经 存在 ， 就 用 新 值 奉 换 旧 值 。 


D in 通过 key in map 这 样 的 语句 ， 在 键 存 在 时 返回 True， 和 否则 返回 False。 
使 用 字典 的 一 大 优势 是 , 给 定 一 个 键 , 能 很 快 找到 其 关联 的 值 。 为 了 提供 这 种 快速 查找 能 





需要 能 支持 高 效 搜索 的 实现 方案 。 虽 然 可 以 使 用 列表 进行 顺序 搜索 或 二 分 搜索 , 但 用 前 面 描述 的 





散 列 表 更 好 ， 这 是 因为 散 列 搜索 算法 的 时 间 复 杂 度 可 以 达到 OU) 。 








代码 清单 5-6 使 用 两 个 列表 创建 HashTable 类 ， 以 此 实现 映射 抽象 数据 类 型 。 其 中 ， 名 为 
slots 的 列表 用 于 存储 键 ， 名 为 aata 的 列表 用 于 存储 值 。 两 个 列表 中 的 键 与 值 一 一 对 应 。 在 本 
节 的 例子 中 ， 散 列表 的 初始 大 小 是 11。 尽 管 初 始 大 小 可 以 任意 指定 ， 但 选用 一 个 素数 很 重要 ， 





这 样 做 可 以 尽 可 能 地 提高 冲突 处 理 算法 的 效率 。 
代码 清单 5-6 ”HashTable 类 的 构造 方法 





1 class HashTable: 

2 def __ init_ _(self): 

3 self.size = 11 

4 self.slots = [None] * self.size 
Ss self.data = [None] * self.size 





在 代码 清单 5-7 中，nashfunction 实现 了 简单 的 取 余 函数 。 处 理 冲 突 时 , 采用 “加 1” 再 
散 列 函数 的 线性 探测 法 。put 函数 假设 ， 除 非 键 已 经 在 self .slots 中 ,否则 总 是 可 以 分 配 一 























个 空 模 。 该 函数 计算 初始 的 散 列 值 ， 如 果 对 应 的 槽 中 已 有 元 素 ， 就 循环 运行 rehas 
参见 一 个 空 模 。 如 果 模 中 已 有 这 个 键 ， 就 用 新 值 蔡 换 旧 值 。 


代码 清单 5-7 put 函数 









































h 函数 ， 直 到 





def put (self, key, data): 
hashvalue = self.hashfunction(key, lenl(self.slots)) 


a 

分 

3 

4 if self.slots[hashvalue] == None: 

5 self.slots[hashvalue] = key 

6 self.data[lhashvalue] = data 

7 else: 

8 if self.slots[hashvalue] 

9 self.data[lhashvalue] 

else: 

nextslot = self.rehash(hashvalue, len(self.slots)) 
while self.slots[nextslot] != None and \ 

self.slots[nextslot] != key: 

nextslot = self.rehash (nextslot, lenl(self.slots)) 


= key: 
data # 替 换 





if self.slots[nextslot] == None: 
self.slots[nextslot] = key 
self.data[lnextslot] = data 


OO PO 
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19 else: 

20 self.data[lnextslot] = data # 替 换 
21 

22 def hashfunction(self, key, size): 

23 return key%size 

必 生 

25 def rehash(self, oldhash, size): 

26 return (oldhash + 1)%Ssize 








同 理 ，get 函数 也 先 计算 初始 散 列 值 ， 如 代码 清单 5-8 所 示 。 如 果 值 不 在 初始 散 列 值 对 应 
槽 中 ， 就 使 用 renasn 确定 下 一 个 位 置 。 注 意 ， 第 15 行 确保 搜索 最 终 一 定 能 结束 ， 
到 初始 槽 。 如 果 遇 到 初始 梭 ， 就 说 明 已 经 检查 完 所 有 可 能 的 槛 ， 并 且 元 素 必 定 不 存在 。 


HashTable it 了 额外 的 字典 功能 。 我 们 重 载 _ getitem 和 
__setitem ,以 通过 [] 进 行 访问 。 这 意味 着 创建 HashTable 类 之 后 , 就 可 以 使 用 熟悉 的 索引 
运算 符 了 。 其 余 方法 的 实现 甸 习作 2 


代码 清单 5-8 ”get 函数 






















































































工 def get (self, key): 
2 startslot = self.hashfunction(key, lenl(self.slots)) 
3 
4 data = None 
5 stop = False 
6 found = False 
7 position = startslot 
8 while self.slots[position] != None and \ 
9 not found and not stop: 
if self.slots[position] == key: 
found = True 
data = self.datalposition] 
else: 
position=self.rehash (position, len(self.slots)) 
if position == startslot: 


stop = True 
return data 





def _ getitem (self, key): 
return self.get (key) 


def _ setitem (self, key, data): 
self.put (key, data) 


下 
ROAD OWRD © 























下 面 来 看 看 运行 情况 。 首 先 创建 一 个 散 列表 并 插入 一 些 元 素 。 其 中 , 键 是 整数 , 值 是 字符 串 。 
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SS TS ELo 

>>> H[20] = "chicken" 

>>> H.slots 

[77, 44, 55, 20, 26, 93, 17, None, None, 31, 54] 
>>> H.data 





Plead "oat A DL TCHNLICkKent, UO 本] GT 
'tiger', None, None, 'cow', 'cat'] 

接 下 来 ,访问 并 修改 散 列 表 中 的 某 些 元 素 。 注 意 ,， 键 20 的 值 已 被 修改 。 

>> HL20] 

'chicken' 

> | 

EE 

su» HL201 Sduck 

>>> HL20] 

'duck' 

>>> H.data 

[二 人 
'tiger', None, None, 'cow', 'cat'] 

>>> print (H[99]) 

None 


4. 分 析 散 列 搜索 算法 





在 最 好 情况 下 ， 散 列 搜索 算法 的 时 间 复 杂 度 是 OQ) ， 即 常数 阶 。 然 而 ， 因 为 可 能 发 生 冲 突 ， 
所 以 比较 次 数 通 常 不 会 这 么 简单 。 尽管 对 散 列 的 完整 分 析 超 出 了 讨论 范围 , 但 是 本 书 在 此 还 是 提 



































一 下 近似 的 比较 次 数 。 





在 分 析 散 列表 的 使 用 情况 时 ， 最 重要 的 信息 就 是 载荷 因子 4 。 从 概念 上 来 说 ， 如 果 14 很 小 ， 
那么 发 生 冲 突 的 概率 就 很 小 , 元 素 也 就 很 有 可 能 各 就 各 位 。 如 果 4 很 大 , 则 意味 着 散 列表 很 拥挤 ， 
发 生 冲 突 的 概率 也 就 很 大 。 因 此 ， 冲 突 解决 起 来 会 更 难 ， 找 到 空 槽 所 需 的 比较 次 数 会 更 多 。 若 采 

















用 链接 法 ， 冲 突 越 多 ， 每 条 链 上 的 元 素 也 越 多 。 


和 之 前 一 样 , 来 看 看 搜索 成 功 和 搜索 失败 的 情况 。 采 用 线性 探测 策略 的 开放 定 址 法 ,搜索 成 





功 的 平均 比较 次 数 如 下 。 


搜索 失败 的 平均 比较 次 数 如 下 。 


若 采 用 链接 法 ， 则 搜索 成 功 的 平均 比较 次 数 如 下 。 


i 
2 





搜索 失败 时 ,平均 比较 次 数 就 是 4 。 
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5.3 排序 


排序 是 指 将 集合 中 的 元 素 按 某 种 顺序 排列 的 过 程 。 比 如 , 一 个 单词 列表 可 以 按 字母 表 或 长 度 
排序 ; 一 个 城市 列表 可 以 按 人 口 、 面 积 或 邮编 排序 。 我 们 已 经 探讨 过 一 些 利 用 有 序列 表 提 高 效率 
的 算法 〈 比如 异 序 词 的 例子 ， 以 及 二 分 搜索 算法 )。 


排序 算法 有 很 多 ,对 它们 的 分 析 也 已 经 很 透彻 了 。 这 说 明 , 排序 是 计算 机 科学 中 的 一 个 重要 
的 研究 领域 。 给 大 量 元 素 排 序 可 能 消耗 大 量 的 计算 资源 。 与 搜索 算法 类 似 , 排序 算法 的 效率 与 待 
处 理 元 素 的 数目 相关 。 对 于 小 型 集合 , 采用 复杂 的 排序 算法 可 能 得 不 偿 失 ; 对 于 大 型 集合 ,需要 
尽 可 能 充分 地 利用 各 种 改善 措施 。 本 节 将 讨论 多 种 排序 技巧 ， 并 比较 它们 的 运行 时 间 。 

在 讨论 具体 的 算法 之 前 ， 先 思考 如 何 分 析 排 序 过 程 。 首 先 ,排序 算法 要 能 比较 大 小 。 为 了 给 
一 个 集合 排序 ， 需 要 某 种 系统 化 的 比较 方法 ,以 检查 元 素 的 排列 是 否 违反 了 顺序 。 在 衡量 排序 过 
程 时 ， 最 常用 的 指标 就 是 总 的 比较 次 数 。 其 次 ， 当 元 素 的 排列 顺序 不 正确 时 ， 需 要 交换 它们 的 位 
置 。 交 换 是 一 个 耗 时 的 操作 ， 总 的 交换 次 数 对 于 衡量 排序 算法 的 总 体 效 率 来 说 也 很 重要 。 



























































5.3.1 冒 泡 排序 


冒 泡 排序 多 次 遍历 列表 。 它 比较 相 邻 的 元 素 ,将 不 合 顺序 的 交换 。 每 一 轮 遍 历 都 将 下 一 个 最 
大 值 放 到 正确 的 位 置 上 。 本 质 上 ， 每 个 元 素 通过 “ 冒 泡 ” 找 到 自己 所 属 的 位 置 。 


5-13 展示 了 冒 泡 排序 的 第 一 轮 遍历 过 程 。 深 色 的 是 正在 比较 的 元 素 。 如 果 列 表 中 有 工 个 
元 素 ， 那 么 第 一 轮 遍 历 要 比较 n-1 对 。 注 意 ， 最 大 的 元 素 会 一 直 往 前 挪 ， 直 到 遍历 过 程 结 束 。 Eo 


第 一 轮 遍 历 


> 
| 54 | 26 | 93 | | 31 [| = >] 交换 位 置 
I7|71314415 120 无 须 交 换 位 置 
这 31 | 44 Br 20 交换 位 置 


[#1T*1" "1 |*1»T:1*| 交换 位 置 






















































































26 |54|17|17|31|4|55|9|20 交换 位 置 






第 一 轮 遍 历 结束 后 ， 
93 位 于 正确 的 位 置 


图 $-13 ” 冒 泡 排序 的 第 一 轮 遍历 过 程 





146 第 5 章 搜索 和 排序 








第 二 轮 遍历 开始 时 ， 最 大 值 已 经 在 正确 位 置 上 了 。 还 剩 二 1 个 元 素 需 要 排列 ， 也 就 是 说 要 比 
较 n-2 对 。 有 既然 每 一 轮 都 将 下 一 个 最 大 的 元 素 放 到 正确 位 置 上 ， 那 么 需要 遍历 的 轮 数 就 是 n-1。 
完成 n-l1 轮 后 ， 最 小 的 元 素 必 然 在 正确 位 置 上 ， 因 此 不 必 再 做 处 理 。 代 码 清单 5-9 给 出 了 完整 的 
bubbleSort 函数 。 该 函数 以 一 个 列表 为 参数 ， 必 要 时 会 交换 其 中 的 元 素 。 


代码 清单 5-9 ” 冒 泡 排序 函数 pubblesort 














1 def bubbleSort (alist): 

全 for passnum in range(len(alist)-1, 0, -1): 
3 for i in range (passnum): 

4 if alist[i] > alist[i+1]: 

5 temp = alist[i] 

6 alist[i] = alist[i+1] 

7 alist[i+1] = temp 











Python 中 的 交换 操作 和 其 他 大 部 分 编程 语言 中 的 略 有 不 同 。 在 交换 两 个 元 素 的 位 置 时 , 通常 
需要 一 个 临时 存储 位 置 (额外 的 内 存 位 置 )。 以 下 代码 片段 交换 列表 中 的 第 i 个 和 第 j 个 元 素 的 位 
置 。 如 果 没 有 临时 存储 位 置 ， 其 中 一 个 值 就 会 被 覆盖 。 

temp = alist[i] 

alist[i] = alist[j] 

alist[j] = temp 

Python 允许 同时 赋值 。 执 行 语句 a，b = b，a， 相 当 于 同时 执行 两 条 赋值 语句 ， 如 图 5-14 
所 示 。 利 用 Python 的 这 一 特性 ， 就 可 以 用 一 条 语句 完成 交换 操作 。 


其 他 大 部 分 编程 语言 需要 3 步 


; 2 









































Python 人 允许 同 时 赋值 
图 5-14 ”对比 Python 与 其 他 大 部 分 编程 语言 的 交换 操作 











在 代码 清单 5-9 中 ， 第 5~7 行 采用 3 步 法 交换 第 i 个 和 第 计 1 个 元 素 的 位 置 。 注 意 ， 也 可 以 
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通过 同时 赋值 来 实现 。 
在 分 析 冒 泡 排序 算法 时 要 注意 , 不 管 一 开始 元 素 是 如 何 排 列 的 , 给 含有 nn 个 元 素 的 列表 排序 
总 需要 遍历 六 1 轮 。 表 5-6 展示 了 每 一 轮 的 比较 次 数 。 总 的 比较 次 数 是 前 n-1 个 整数 之 和 。 由 于 


a 3 1 1 a 这 “es 半 1 1 1 本 
前 7 个 整数 之 和 是 二 tn 因此 前 二 1 个 整数 之 和 就 是 2 ty 即 3 JP。 这 表明 ， 


该 算法 的 时 间 复 杂 度 是 O(n ) 。 在 最 好 情况 下 ， 列 表 已 经 是 有 序 的 ， 不 需要 执行 交换 操作 。 在 最 
坏 情况 下 ， 每 一 次 比较 都 将 导致 一 次 交换 。 


表 5-6 ” 冒 泡 排序 中 每 一 轮 的 比较 次 数 






































轮 次 比较 次 数 
1 n—l 
2 n—2 


3 n—3 
| | 
冒 泡 排序 通常 被 认为 是 效率 最 低 的 排序 算法 ， 因 为 在 确定 最 终 的 位 置 前 必须 交换 元 素 。“ 多 
余 ” 的 交换 操作 代价 很 大 。 不过， 由 于 冒 泡 排序 要 遍历 列表 中 未 排序 的 部 分 ， 因 此 它 具 有 其 他 排 
序 算法 没有 的 用 途 。 特 别 是 ， 如 果 在 一 轮 遍 历 中 没有 发 生 元 素 交 换 ， 就 可 以 确定 列表 已 经 有 序 。 
可 以 修改 冒 泡 排 序 函 数 , 使 其 在 遇 到 这 种 情况 时 提前 终止 。 对 于 只 需要 遍历 几 次 的 列表 ， 冒 泡 排 
序 可 能 有 优势 ， 因 为 它 能 判断 出 有 序列 表 并 终止 排序 过 程 。 代 码 清 单 5-10 实现 了 如 上 所 述 的 修 
改 ， 这 种 排序 通常 被 称 作 短 冒 泡 。 


代码 清单 5-10 ”修改 后 的 冒 泡 排序 函数 



























































1 def shortBubbleSort (alist): 

2 exchanges = True 

3 passnum = len(alist)-1 

4 while passnum > 0 and exchanges: 
5 exchanges = False 

6 for i in range(passnum): 

所 if alist[i] > alist[i+1]: 
8 exchanges = True 


9 temp = alist[i] 

10 alist[i] = alist[i+1] 
并 于 alist[i+1] = temp 

机 2 passnum = passnum -1 





5.3.2 ”选择 排序 


选择 排序 在 冒 泡 排 序 的 基础 上 做 了 改进 , 每 次 遍历 列表 时 只 做 一 次 交换 。 要 实现 这 一 点 , 选 
择 排 序 在 每 次 遍历 时 寻找 最 大 值 ， 并 在 遍历 完 之 后 将 它 放 到 正确 位 置 上 。 和 冒 泡 排序 一 样 , 第 一 
次 遍历 后 , 最 大 的 元 素 就 位 ; 第 二 次 遍历 后 , 第 二 大 的 元 素 就 位 , 依 此 类 推 。 若 给 n 个 元 素 排序 ， 
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需要 遍历 n-1 轮 ， 这 是 因为 最 后 一 个 元 素 要 到 n-1 轮 饥 历 后 才 就 位 。 


图 5-15 展示 了 完整 的 选择 排序 过 程 。 每 一 轮 遍 历 都 选择 待 排序 元 素 中 最 大 的 元 素 ， 并 将 其 
放 到 正确 位 置 上 。 第 一 轮 放 好 93 ， 第 二 轮 放 好 77， 第 三 轮 放 好 55， 依 此 类 推 。 代 码 清单 5-11 
给 出 了 选择 排序 函数 。 


回国 回回 硬 加 回国 国 必 
#11" eT) we 
6 | 4- | 20: | 17 31 | 44 | 77 | 93 | 最 大 值 是 55 
ET) ses 
1 

位 置 不 变 


TD we 














EPE we 





图 5-15 选择 排序 





代码 清单 5-11 ”选择 排序 函数 selectionsSort 


def selectionSort (alist): 
for fillslot in range(len(alist)-1, 0, -1): 
positionOfMax = 0 
for location in range(1, fillslot+l1): 
if alist[location] > alist[positionOfMax]: 
positionOfMax = location 





temp = alist[fillslot] 
alist[fillslot] = alist[lpositionOfMax] 
alist[positionOfMax] = temp 


Fo 性 wwND 哺 


Le 
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可 以 看 出 ， 选 择 排 序 算法 和 冒 泡 排 序 算法 的 比较 次 数 相同 ， 所 以 时 间 复 杂 度 也 是 O(n?) 。 但 
是 ,由 于 减少 了 交换 次 数 ， 因 此 选择 排序 算法 通常 更 快 。 就 本 节 的 列表 示例 而 言 ， 冒 泡 排序 交换 
了 20 次 ， 而 选择 排序 只 需 交 换 8 次 。 


5.3.3 ”插入 排序 


插入 排序 的 时 间 复 杂 度 也 是 O(m”) ， 但 原理 稍 有 不 同 。 它 在 列表 较 低 的 一 端 维护 一 个 有 序 的 
子 列表 ， 并 逐个 将 每 个 新 元 素 “ 择 入 ”这 个 子 列表 。 图 5-16 展示 了 搬入 排序 的 过 程 。 深 色 元 素 
代表 有 序 子 列表 中 的 元 素 。 


1 
ET TD] we 
回回 回回 加 可 可 OES 
回回 回回 加 本 四 回回 Ey 

加 加 团团 回 加 回回 加 ES 
Es 
回回 国 加 回回 回国 加 已， 
回回 国 回国 国 加 回回 站 
PE)" 

图 5-16 插入 排序 


首先 假设 位 置 0 处 的 元 素 是 只 含 单个 元 素 的 有 序 子 列 表 。 从 元 素 1 到 元 素 n-1， 每 一 轮 都 将 
当前 元 素 与 有 序 子 列表 中 的 元 素 进行 比较 。 在 有 序 子 列表 中 , 将 比 它 大 的 元 素 右 移 ; 当 遇 到 一 个 
比 它 小 的 元 素 或 抵达 子 列表 终点 时 ， 就 可 以 插 和 人 当前 元 素 。 

图 5-17 详细 展示 了 第 5 轮 遍历 的 情况 。 此 刻 ， 有 序 子 列表 包含 5 个 元 素 : 17、26、54、77 
和 93。 现 在 想 搬入 31。 第 一 次 与 93 比较 ， 结 果 是 将 93 向 右 移 ; 同 理 ，77 和 54 也 向 右 移 。 
遇 到 26 时 ， 就 不 移 了 ， 并 且 31 找到 了 正确 位 置 。 现 在 ， 有 序 子 列表 有 6 个 元 素 。 
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因为 93 > 31， 
所 以 将 93 向 右 移 

















因为 77 > 31， 
所 以 将 77 向 右 移 











因为 54 > 31， 
所 以 将 54 向 右 移 


EL) “ew 


图 5-17 插入 排序 的 第 5 轮 遍历 
从 代码 清单 5-12 可 知 ,在 给 个 元 素 排序 时 , 插入 排序 算法 需要 遍历 -1 轮 。 循环 从 位 置 1 
开始 ， 直 到 位 置 n-1 结束 ， 这 些 元 素 都 需要 被 插 人 到 有 序 子 列表 中 。 第 8 行 实现 了 移动 操作 , 将 
列表 中 的 一 个 值 挪 一 个 位 置 ， 为 待 插入 元 素 腾 出 空间 。 要 记 住 ， 这 不 是 之 前 的 算法 进行 的 那 种 完 
整 的 交换 操作 。 


代码 清单 5-12 ”插入 排序 函数 insertionSort 






































def insertionSort (alist): 
for index in range(1, lenl(alist)): 


currentvalue = alist[index] 
position = index 


while position > 0 and alist[position-1] > currentvalue: 
alist[position] = alist[lposition-1] 


1 
2 
3 
4 
5 
6 
7 
8 
9 position = position-1 
下 

工 


Ln， 


alist[position] = currentvalue 

















在 最 坏 情况 下 , 插入 排序 算法 的 比较 次 数 是 前 n-l 个 整数 之 和 , 对 应 的 时 间 复 杂 度 是 O(n?) 。 
在 最 好 情况 下 ( 列表 已 经 是 有 序 的 )， 每 一 轮 只 需 比 较 一 次 。 

移动 操作 和 交换 操作 有 一 个 重要 的 不 同 点 。 总 体 来 说 , 交换 操作 的 处 理 时 间 大 约 是 移动 操作 
的 3 倍 ， 因 为 后 者 只 需 进行 一 次 赋值 。 在 基准 测试 中 ,插入 排序 算法 的 性 能 很 不 错 。 
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5.3.4 和 希 尔 排序 


希 尔 排序 也 称 “ 递 减 增 量 排序 "， 它 对 插入 排序 做 了 改进 ， 将 列表 分 成 数 个 子 列表 ， 并 对 每 

一 个 子 列表 应 用 插入 排序 。 如 何 切 分 列表 是 希 尔 排序 的 关键 一 一 并 不 是 连续 切 分 , 而 是 使 用 增 量 

i ( 有 时 称 作 步 长 ) 选取 所 有 间隔 为 i 的 元 素 组 成 子 列表 。 

以 图 5-18 中 的 列表 为 例 ， 这 个 列表 有 9 个 元 素 。 如 果 增 量 为 3， 就 有 A 每 个 都 可 

以 应 用 插入 排序 ， 结 果 如 图 5-19 所 示 。 尽 管 列表 仍然 不 算 完全 有 序 ， 但 通过 给 子 列表 排序 ， 我 
们 已 经 让 元 素 离 它们 的 最 终 位 置 更 近 了 。 



















































































子 列 表 1 


子 列表 2 


子 列表 3 





图 5-18” 增 量 为 3 的 希 尔 排序 


DD DD GD mm 


子 列表 2 的 排序 结果 








子 列表 3 的 排序 结果 


TT) oem 














图 $-19 ”为 每 个 子 列 表 排序 后 的 结果 


5-20 展示 了 最 终 的 搬入 排序 过 程 。 由 于 有 了 之 前 的 子 列 表 排序 ， 因 此 总 移动 次 数 已 经 减 
少 了 。 0 ! 需 要 再 移动 4 次 。 
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加 四 四 四 回国 回回 
ts 

加 而 图 国 国 加 图 图 图 

Rec 
[|] ls |]7]») wm 
ber 
[a [sl [ss [7 ) wr 


图 5-20 ”最终 进行 插入 排序 

如 前 所 述 ， 如 何 切 分 列表 是 希 尔 排序 的 关键 。 代 码 清单 5-13 中 的 函数 采用 了 另 一 组 增 量 。 
先 为 5 个 子 列表 排序 ， 接 着 是 < 个 子 列表 。 最 终 ， 整 个 列表 由 基本 的 插入 排序 算法 排 好 序 。 图 
5-21 展示 了 采用 这 种 增 量 后 的 第 一 批 子 列表 。 


于 列表 4 





移动 2 次 























图 5-21 和 希 尔 排序 的 初始 子 列表 


代码 清单 5-13 希 尔 排序 函数 shellsort 


1 def shellSort (alist): 
2 sublistcount = len(alist) // 2 
3 while sublistcount > 0: 
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4 
与 for startposition in range(sublistcount): 
6 gapInsertionSort(alist, startposition, sublistcount) 
7 
8 print ("After increments of size", sublistcount, 
9 "The list is", alist) 
于 0 
11 sublistcount = sublistcount // 2 
汕 浊 
13 def gapInsertionSort(alist, start, gap): 
Td for i in range(start+gap, len(alist), gap): 
小 每 
16 currentvalue = alist[il 
17 position = i 
18 
小 人 9 while position >= gap and \ 
20 alist[position-gap] > currentvalue: 
2 alist[position] = alist[lposition-gap] 
22 position = position-gap 
23 
24 alist[position] = currentvalue 
下 面 对 shellsort 的 调用 示例 给 出 了 使 用 每 个 增 量 之 后 的 结果 ( 部 分 有 序 ), 以 及 增 量 为 1 
的 插入 排序 结果 。 





> GliBt ST EDdy 267 03 LY TY Bl; 44 557 20) 
>>> shellSort (alist) 
After increments of size 4 the list is 

[L208 :26%. 4 “LY Dr SL 937 DOs) 
After increments of size 2 the list is 

[L208 Tm. dd; 267 Da 3 Ly Ho 93 
After increments of size 1 the list is 

El 20 26 3a. dd DAF DO Wy 9A 


乍 看 之 下 , 你 可 能 会 觉得 希 尔 排 序 不 可 能 比 插 入 排序 好 ,因为 最 后 一 步 要 做 一 次 完整 的 插入 
排序 。 但 实际 上 , 列表 已 经 由 增 量 的 插入 排序 做 了 预 处 理 ， 所 以 最 后 一 步 插 入 排序 不 需要 进行 
次 比较 或 移动 。 也 就 是 说 ， 每 一 轮 遍 历 都 生成 了 “更 有 序 ” 的 列表 ， 这 使 得 最 后 一 步 非 常 高 效 。 

尽管 对 希 尔 排序 的 总 体 分 析 已 经 超出 了 本 书 的 讨论 范围 ， 但 是 不 妨 了 解 一 下 它 的 时 间 复 杂 
度 。 基 于 上 述 行为 ， 希 尔 排序 的 时 间 复 杂 度 大 概 介 于 O(n) 和 O(n?) 之 间 。 若 采用 代码 清单 5-13 
中 的 增 量 ， 则 时 间 复 杂 度 是 O(n ) 。 通 过 改变 增 量 ， 比 如 采用 2* -1( 1,3,7,15,31,… ),， 希 尔 排 















































序 的 时 间 复 杂 度 可 以 达到 O(n?) 。 


5.3.5 “归并 排序 


现在 ， 我 们 将 注意 力 转向 使 用 分 治 策略 改进 排序 算法 。 要 研究 的 第 一 个 算法 是 归并 排序 ， 它 
递归 算法 ， 每 次 将 一 个 列表 一 分 为 二 。 如 果 列 表 为 空 或 只 有 一 个 元 素 ， 那 么 从 定义 上 来 说 它 就 
有 序 的 ( 基本 情况 )。 如 果 列 表 不 止 一 个 元 素 ， 就 将 列表 一 分 为 二 ， 并 对 两 部 分 都 递归 调用 归并 

















是 
是 
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排序 。 当 两 部 分 都 有 序 后 ， 就 进行 归并 这 一 基本 操作 。 归 并 是 指 将 两 个 较 小 的 有 序列 表 归 并 为 一 
个 有 序列 表 的 过 程 ,图 5-22a 展示 了 示例 列表 被 拆 分 后 的 情况 ,图 5-22b 给 出 了 归并 后 的 有 序列 表 。 


国 国 加 四 回国 四国 占 










(a) 拆 分 


回国 回回 四 四 日 
四 回回 蝇 回 
回国 国 国 加 回国 加 加 


(b) 归并 
图 5-22 归并 排序 中 的 拆 分 和 归并 
在 代码 清单 5-14 中 , mergeSort 函数 以 处 理 基本 情况 开始 。 如 果 列 表 的 长 度 小 于 或 等 于 1， 


说 明 它 已 经 是 有 序列 表 ， 因 此 不 需要 做 额外 的 处 理 。 如 果 长 度 大 于 1, 则 通过 Python 的 切片 操作 
得 到 左 半 部 分 和 右 半 部 分 。 要 注意 ,列表 所 含 元 素 的 个 数 可 能 不 是 偶数 。 这 并 没有 关系 ， 因 为 左 
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右 子 列表 的 长 度 最 多 相差 1。 
代码 清单 5-14 ”归并 排序 函数 mergesort 





4 def mergeSort (alist): 

2 print ("Splitting ", alist) 
3 if Leém(aliest) Ss 1: 

4 mid = len(alist) // 2 

5 lefthalf = alist[:mid] 
6 righthalf = alist[mid:] 
3 
8 
9 


mergeSort (lefthalf) 
mergeSort (righthalf) 














10 

于 1 0 

12 | 

13 k=0 

14 while i < len(lefthalf) and j < len(righthalf): 
bs if lefthalf[i] < righthalf[j]: 
16 alist[k] = lefthalf[il] 
Wy J 证 让 

18 else: 

19 alist[k] = righthalf[j] 
20 于 三 下 十- 站 

21 k= k+1 

22 

23 while i < len(lefthalf): 

24 alist[k] = lefthalf[il] 

之 号 i=i+1 

26 k= k+1 

27 

28 while j < len(righthalf): 

29 alist[k] = righthalf[j] 

30 j 王 - 柯 :幸村 

3 下 k= k+1 

82 print ("Merging ", alist) 








在 第 8~9 行 对 左右 子 列表 调用 mergesort 函数 后 ， 就 假设 它们 已 经 排 好 序 了 。 第 11~31 行 
负责 将 两 个 小 的 有 序列 表 归 并 为 一 个 大 的 有 序列 表 。 注意 , 归并 操作 每 次 从 有 序列 表 中 取出 最 小 
值 ， 放 回 初始 列表 (alist )。 


mergeSort 因数 有 一 条 print 语句 (第 2 行 ), 用 于 在 每 次 调用 开始 时 展示 等 排序 列表 的 内 
容 。 第 32 行 也 有 一 条 print 语句 ， 用 于 展示 归并 过 程 。 以 下 脚本 展示 了 针对 示例 列表 执行 
mergeSort 函数 的 结果 。 注 意 ， 列 表 [44，55，20] 不 会 均 分 ， 第 一 部 分 是 [44] ， 第 二 部 分 是 
[55，20]。 很 容易 看 出 ， 拆 分 操作 最 终生 成 了 能 立即 与 其 他 有 序列 表 归 并 的 列表 。 

SS Ed D6 93 BY TY By. dd BD. Ou 

>>> mergeSort (pb) 

Splitting 94 26 93 Ly TS. BL Md S520 

SBLiCCIAY, F547 -267 335. “27] 

Splitting [54, 26] 

SELLttind. S54] 
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Merging [54] 
Splitting [26] 
Merging [26] 
Merging [26, 54] 
SBblitting [93; .17] 
Splitting [93] 
Merging [93] 
Splitting [17] 
Merging [17] 
Merging [17, 93] 

Merging [17, 26, 54, 93] 
SplITtting. E77 S31... -56720 
Splitting [77, 31] 

Splittirng’ [77 
Merging [77] 
Splittimng: SL 
Merging [31] 
Merging [31, 77] 
SHIittirnd (44 55: . 20 
Splitting [44 
Merging [44] 
SDLittind [SS "20 
Splitting [55 
Merging [55] 
Splitting [20 
Merging [20] 
Merging [20, 55] 

Merging [20, 44, 55] 

Merging [20, 31, 44, 55, 77] 

Merging [17, 20, 26, 31, 44, 54, 55, 77, 93] 
SS 




















分 析 mergeSort 函数 时 ， 要 考虑 它 的 两 个 独立 的 构成 部 分 。 首 先 ， 列 表 被 一 分 为 二 。 在 学 
习 二 分 搜索 时 已 经 算 过 ， 当 列表 的 长 度 为 n 时 ， 能 切 分 logn 次 。 第 二 个 处 理 过 程 是 归并 。 列 表 
中 的 每 个 元 素 最 终 都 得 到 处 理 ， 并 被 放 到 有 序列 表 中 。 所 以 ， 得 到 长 度 为 n 的 列表 需要 进行 n 次 
操作 。 由 此 可 知 ， 需 要 进行 logn 次 拆 分 ,每 一 次 需要 进行 n 次 操作 ， 所 以 一 共 是 nlogn 次 操作 。 
也 就 是 说 ， 归 并 排序 算法 的 时 间 复 杂 度 是 O(nlogn) 。 

你 应 该 记得 ， 切 片 操作 的 时 间 复 杂 度 是 O(6) ， 其 中 大 是 切片 的 大 小 。 为 了 保证 mergesort 
函数 的 时 间 复 杂 度 是 O(xlogz) ， 需 要 去 除 切 片 运算 符 。 在 进行 递归 调用 时 , 传人 头 和 尾 的 下 标 即 
可 做 到 这 一 点 。 我 们 将 此 留 作 练习 。 

有 一 点 要 注意 : mergeSort 函数 需要 额外 的 空间 来 存储 切片 操作 得 到 的 两 半 部 分 。 当 列表 
较 大 时 ， 使 用 额外 的 空间 可 能 会 使 排序 出 现 问题 。 









































5.3.6 快速 排序 


和 归并 排序 一 样 ， 快 速 排 序 也 采用 分 治 策略 , 但 不 使 用 额外 的 存储 空间 。 不 过 ,代价 是 列表 
可 能 不 会 被 一 分 为 二 。 出 现 这 种 情况 时 ， 算 法 的 效率 会 有 所 下 降 。 
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快速 排序 算法 首先 选 出 一 个 基准 值 。 尽 管 有 很 多 种 选 法 ,但 为 简单 起 见 ， 本 节选 取 列 表 中 的 
一 个 元 素 。 基 准 值 的 作用 是 帮助 切 分 列表 。 在 最 终 的 有 序列 表 中 ， 基准 值 的 位 置 通常 被 称 作 分 
割 点 ， 算 法 在 分 割 点 切 分 列表 ， 以 进行 对 快速 排序 的 子 调 用 。 
在 图 5-23 中 , 元 素 54 将 作为 第 一 个 基准 值 。 从 前 面 的 例子 可 知 ，54 最 终 应 该 位 于 31 当前 
所 在 的 位 置 。 下 一 步 是 分 区 操作 。 它 会 找到 分 割 点 ， 同 时 将 其 他 元 素 放 到 正确 的 一 边 一 一 要 么 大 
于 基准 值 ， 要 么 小 于 基准 值 。 


图 5-23 ”快速 排序 的 第 一 个 基准 值 


分 区 操作 首先 找到 两 个 坐标 leftmark 和 rightmark- 它们 分 别 位 于 列表 剩余 元 素 
的 开头 和 末尾 ， 如 图 5-24 所 示 。 分 区 的 目的 是 根据 待 排序 元 素 与 基准 值 的 相对 大 小 将 它们 放 到 
正确 的 一 边 ， 同 时 逐渐 到 近 分 割 点 。 图 5-24 展示 了 为 元 素 54 寻找 正确 位 置 的 过 程 。 


I) 
CT we 



































leftmark—> 二 一 工 ightmark 
26<54，leftmark 右 移 
93 | 17 1771311441355 | 20 93>54” 止 步 
leftmark rightmark 








轮 到 rightmark 
54|126193117177131144155 1 20 20254, 下 要 


leftmark rightmark 


加 四 四 回回 加 四 EE 


leftmark rightmark 


继续 移动 leftmark 和 rightmark 


77>54， 止 步 
54 | 26 | 20 祈 44 | 55 | 93 44<54， 止 步 
44 和 77 互 换 位 置 


要 一 -一 





leftmark rightmark 





77>54， 止 步 
Tr 和 

righntmark<leftmark 

找到 分 割 点 

31 和 54 互 换 位 置 


rightmark leftmark 
——> 


= 
直至 交错 
图 5-24 为 54 寻找 正确 位 置 
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首先 加 大 leftmark， 直 到 遇 到 一 个 大 于 基准 值 的 元 素 。 然 后 减 小 rightmark， 直 到 遇 到 
一 个 小 于 基准 值 的 元 素 。 这 样 一 来 ， 就 找到 两 个 与 最 终 的 分 割 点 错 序 的 元 素 。 本 例 中 ,这 两 个 元 
素 就 是 93 和 20。 互 换 这 两 个 元 素 的 位 置 ， 然 后 重复 上 述 过 程 。 

当 rightmark 小 于 leftmark 时 ， 过程 终止 。 此 时 ，rightmark 的 位 置 就 是 分 割 点 。 将 
基准 值 与 当前 位 于 分 割 点 的 元 素 互 换 ， 即 可 使 基准 值 位 于 正确 位 置 ， 如 图 5-25 所 示 。 分 割 点 左 
边 的 所 有 元 素 都 小 于 基准 值 ， 右 边 的 所 有 元 素 都 大 于 基准 值 。 因 此 ,可 以 在 分 割 点 处 将 列表 一 分 
为 二 ， 并 针对 左右 两 部 分 递归 调用 快速 排序 函数 。 















































EDIT 
<54 >54 
针对 左边 的 部 分 进行 快速 排序 针对 右边 的 部 分 进行 快速 排序 








图 5-25 ”基准 值 54 就 位 


在 代码 清单 5-15 中 ,快速 排序 函数 quicksort 调用 了 递归 函数 quickSortHelper。 
quickSortHelper 首先 处 理 和 归并 排序 相同 的 基本 情况 。 如 果 列 表 的 长 度 小 于 或 等 于 1, 说 明 
它 已 经 是 有 序列 表 ; 如 果 长 度 大 于 1， 则 进行 分 区 操作 并 递归 地 排序 。 分 区 函数 part ition 实 
现 了 前 面 描述 的 过 程 。 


代码 清单 5-15 ”快速 排序 函数 quicksort 



































def quickSort (alist): 
quickSortHelper (alist, 0, len(alist)-1) 


1 

芝 

3 

4 def quickSortHelper(alist, first, last): 
S Tf {first < last: 
6 

7 

8 

9 


splitpoint = partition(alist, first, last) 


quickSortHelper(alist, first, splitpoint-1) 
quickSortHelper(alist, splitpoint+1, last) 





def partition(alist, first, last): 
pivotvalue = alist[first] 


leftmark = first + 1 
rightmark = last 


ov~ OOD 必 wm 有 口 
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19 done = False 

20 while not done: 

2 

及 沁 while leftmark <= rightmark and \ 

2.3 alist[leftmark] <= pivotvalue: 
24 leftmark = leftmark + 1 

多 

26 while alist[rightmark] >= pivotvalue and \ 
27 rightmark >= leftmark: 

28 rightmark = rightmark — 1 

2.9 

30 if rightmark < leftmark: 

31 done = True 

32 else: 

33 temp = alist[leftmark] 

34 alist[leftmark] = alist[rightmark] 
35 alist[rightmark] = temp 

36 

:7 temp = alist[first] 

38 alist[first] = alist[rightmark] 

8:9 alist[rightmark] = temp 

40 

41 

42 return rightmark 























在 分 析 quicksort 函数 时 要 注意 ， 对 于 长 度 为 n 的 列表 ， 如 果 分 区 操作 总 是 发 生 在 列表 的 
中 部 ， 就 会 切 分 logn 次 。 为 了 找到 分 割 点 ，7 个 元 素 都 要 与 基准 值 比较 。 所 以 ， 时 间 复 杂 度 是 
O(nlogn) 。 男 外 ,快速 排序 算法 不 需要 像 归 并 排序 算法 那样 使 用 额外 的 存储 空间 。 

不 地 的 是 ， 最 坏 情况 下 ,分割 点 不 在 列表 的 中 部 ， 而 是 偏 癌 某 一 端 ， 这 会 导致 切 分 不 均匀 。 
在 这 种 情况 下 , 含有 个 元 素 的 列表 可 能 被 分 成 一 个 不 含 元 素 的 列表 与 一 个 含有 n-l 个 元 素 的 列 
表 。 然 后 ,含有 n-l 个 元 素 的 列表 可 能 会 被 分 成 不 含 元 素 的 列表 与 一 个 含有 n-2 个 元 素 的 列表 ， 
依 此 类 推 。 这 会 导致 时 间 复 杂 度 变 为 O(n*") ， 因 为 还 要 加 上 递归 的 开销 。 

前 面 提 过 ,有 多 种 选择 基准 值 的 方法 。 可 以 尝试 使 用 三 数 取 中 法 避免 切 分 不 均匀 ， 即 在 选择 
基准 值 时 考虑 列表 的 头 元 素 、 中 间 元 素 与 尾 元 素 。 本 例 中 ， 先 选取 元 素 54、77 和 20， 然 后 取 
中 间 值 54 作为 基准 值 ( 当然 ， 它 也 是 之 前 选择 的 基准 值 ) 这 种 方法 的 思路 是 ， 如 果 头 元 素 的 
正确 位 置 不 在 列表 中 部 附近 , 那么 三 元 素 的 中 间 值 将 更 靠近 中 部 。 当 原始 列表 的 起 始 部 分 已 经 有 
序 时 ， 这 一 招 尤其 管用 。 我 们 将 这 种 基准 值 选 法 的 实现 留 作 练习 。 


5.4 小 结 
口 不 论 列 表 是 否 有 序 ， 顺序 搜索 算法 的 时 间 复 杂 度 都 是 O(n) 。 
口 对 于 有 序列 表 来 说 ， 二 分 搜索 算法 在 最 坏 情况 下 的 时 间 复 杂 度 是 O(logn) 。 


口 基于 散 列表 的 搜索 算法 可 以 达到 常数 阶 。 
口 冒 泡 排序 、 选 择 排序 和 插入 排序 都 是 O(n?) 算法 。 
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口 希 尔 排序 通过 给 子 列表 排序 ， 改 进 了 插入 排序 。 它 的 时 间 复 杂 度 介 于 O(n) 和 O(n ) 之 间 。 
口 归并 排序 的 时 间 复 杂 度 是 O(nlogn) ， 但 是 归并 过 程 需要 用 到 额外 的 存储 空间 。 

口 快速 排序 的 时 间 复 困 度 是 O(nlogn) ， 但 当 分 割 点 不 靠近 列表 中 部 时 会 降 到 O(n”) 。 它 不 
需要 使 用 额外 的 存储 空间 。 




































































5.5 关键 术语 


5.6 









































步 长 模 插入 排序 
冲突 冲突 处 理 短 冒 泡 
二 分 搜索 分 割 点 分 区 
归并 归并 排序 基准 值 
聚集 开放 定 址 法 快速 排序 
链接 法 冒 泡 排序 平方 取 中 法 
平方 探测 三 数 取 中 法 散 列 
散 列 表 散 列 函数 顺序 搜索 
完美 散 列 函数 希 尔 排序 线性 探测 
选择 排序 映射 载 往 因子 
再 散 列 折 秋 法 

讨论 题 


1. ”利用 本 章 给 出 的 公式 ， 计 算 散 列表 处 于 以 下 情况 时 的 平均 比较 次 数 : 
口 占用 率 为 10%; 
口 占用 率 为 25%; 
口 占用 率 为 50%; 
口 占用 率 为 75%; 
口 占用 率 为 90%; 
口 占用 率 为 99%。 


你 认为 在 哪 种 情况 下 散 列 表 过 小 ?请 给 出 理由 。 

修改 为 字符 串 构 建 的 散 列 函数 ， 用 字符 位 置 作为 权重 因子 。 

请 为 字符 串 散 列 函 数 设 计 另 一 种 权重 机 制 。 这 些 函 数 存在 什么 偏差 ? 

研究 完美 散 列 函数 。 针对 一 个 名 字 列 表 ( 同学 、 家 人 等 ), 使 用 完美 散 列 函数 生成 散 列 值 。 
随机 生成 一 个 整数 列表 。 展 示 如 何 用 下 列 算法 为 该 列表 排序 : 

口 冒 泡 排序 ; 























J 























5.7 ”编程 练习 161 





5.7 


1 . 


口 选择 排序 ; 
口 插入 排序 ; 





口 希 尔 排序 ( 自 
口 归并 排序 ; 

口 快速 排序 〈 自 
针对 整数 列表 [1 
排序 : 

口 冒 泡 排 序 ; 

口 选择 排序 ; 

口 插入 排序 ; 


己 决 定 增 量 ) 





己 决定 基准 值 ) 。 


2.3 3 4， 5 6, hs 8, 9 





口 希 尔 排 序 ( 自 
口 归并 排序 ; 

口 快速 排序 ( 自 
针对 整数 列表 [1 
排序 : 

口 崩 泡 排序 ; 

口 选择 排序 ; 

口 插入 排序 ; 


己 决 定 增 量 


) 3 





己 决定 基准 值 ) 。 


日 9p Br “bw B73 


Es 





口 希 尔 排 序 ( 自 
口 归并 排序 ; 
口 快速 排序 ( 自 





口 崩 泡 排序 ; 
口 选择 排序 ; 
口 插入 排序 ; 


针对 字符 列表 ['P'，'Y， 





己 决定 基准 值 ) 。 
Y 





口 希 尔 排 序 ( 自 
口 归并 排序 ; 
口 快速 排序 〈 自 








己 决定 基准 值 ) 。 


] ?9 


， 展 示 如 何 用 下 列 算法 为 该 列表 


展示 如 何 用 下 列 算法 为 该 列表 





'0'，'N'] ， 展 示 如 何 用 下 列 算法 为 该 列表 排序 : 


为 快速 排序 算法 设计 男 一 种 选择 基准 值 的 策略 ， 比 如 选择 中 间 元 素 。 重 新 实现 算法 , 并 
为 随机 数据 集 排序 。 在 什么 情况 下 ， 你 的 策略 会 优 于 (或 劣 于 ) 本 章 所 采用 的 策略 ? 


编程 练习 





进行 随机 实验 ,测试 顺序 搜索 算法 与 二 分 搜索 算法 在 处 理 整 数列 表 时 的 差异 。 
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2. 随机 生成 一 个 有 序 的 整数 列表 。 通 过 基准 测试 分 析 文中 给 出 的 二 分 搜索 函数 ( 递归 版 本 
与 循环 版 本 )。 请 解释 你 得 到 的 结 

3.， 不 用 切片 运算 符 ， 实 现 递 归 版 本 的 二 分 搜索 算法 。 别 忘 了 传人 头 元 素 和 尾 元 素 的 下 标 。 
随机 生成 一 个 有 序 的 整数 列表 ， 并 进行 基准 测试 。 

4. 为 散 列 表 实 现 len 方 法 (_ len ) 

5.， 为 散 列 表 实 现 in 方法 (contains_ _ )。 

6. ”采用 链接 法 处 理 冲突 时 , 如何 从 散 列 表 中 删除 元 素 ? 如 果 是 采用 开放 定 址 法 ,又 如 何 做 
呢 ? 有 什么 必须 处 理 的 特殊 情况 ? 请 为 HashTable 类 实现 ael 方法 。 

7. 在 本 章 中 ， 散 列表 的 大 小 为 11。 如 果 表 满 了 ， 就 需要 增 大 。 请 重新 实现 put 方法 ,使 
得 散 列表 可 以 在 载荷 因子 达到 一 个 预 设 值 时 自动 调整 大 小 (可 以 根据 载荷 对 性 能 的 影 
响 ， 自 己 决 定 预 设 值 )。 

8. ”实现 平方 探测 这 一 再 散 列 技巧 。 

9. ”使 用 随机 数 生 成 器 创建 一 个 含 500 个 整数 的 列表 。 通 过 基准 测试 分 析 本 章 中 的 排序 算 
法 。 它 们 在 执行 速度 上 有 什么 差别 ? 

10. 利用 同时 赋值 特性 实现 冒 泡 排序 。 

11， 可 以 将 冒 泡 排 序 算法 修改 为 向 两 个 方向 “ 冒 泡 ”。 第 一 轮 沿 着 列表 “向 上 ”遍历 ， 第 二 
轮 沿 着 列表 “向 下 ”遍历 。 继 续 这 一 模式 ， 直 到 无 须 遍历 为 止 。 实 现 这 种 排序 算法 ， 并 
描述 它 的 适用 情形 。 

12， 利用 同时 赋值 特性 实现 选择 排序 。 

13， 针 对 同一 个 列表 使 用 不 同 的 增 量 集 ， 为 希 尔 排序 进行 基准 测试 。 

14. 不 使 用 切片 运算 符 ， 实 现 mergesort 函数 。 

15， 有 一 种 改进 快速 排序 的 办 法 , 那 就 是 在 列表 长 度 小 于 某 个 值 时 采用 插入 排序 ( 这 个 值 被 
称 为 “分 区 限制 ”)。 这 是 什么 道理 ? 重新 实现 快速 排序 算法 , 并 给 一 个 随机 整数 列表 排 
序 。 采 用 不 同 的 分 区 限制 进行 性 能 分 析 。 

16， 修改 quicksort 函数 ， 在 选取 基准 值 时 采用 三 数 取 中 法 。 通 过 实验 对 比 两 种 技巧 的 性 


他 闫 已 
有 此 和 夺 庆 。o 
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6.1 本 章 目标 


口 理解 树 这 种 数据 结构 及 其 用 法 。 
口 了解 如 何 用 树 实现 映射 。 

口 用 列表 实现 树 。 

口 用 类 和 引用 实现 树 。 

口 将 树 实现 为 递归 数据 结构 。 

口 用 堆 实现 优先 级 队列 。 


6.2 示例 


我 们 已 经 学 习 了 栈 和 队列 等 线性 数据 结构 , 并 对 递归 有 了 一 定 的 了 解 , 现在 来 学 习 树 这 种 常 
见 的 数据 结构 。 树 广泛 应 用 于 计算 机 科学 的 多 个 领域 ， 从 操作 系统 、 图 形 学 、 数 据 库 到 计算 机 网 
络 。 作 为 数据 结构 的 树 和 现实 世界 中 的 树 有 很 多 共同 之 处 , 二 者 乡 有 根 、 枝 、 叶 。 不 同 之 处 在 于 ， 
前 者 的 根 在 项 部 ， 而 叶 在 底部 。 


在 研究 树 之 前 ， 先 来 看 一 些 例子 。 第 一 个 例子 是 生物 学 中 的 分 类 树 。 图 6-1 从 生物 分 类 学 的 
角度 给 出 了 某 些 动物 的 类 别 ， 从 这 个 简单 的 例子 中 , 我 们 可 以 了 解 树 的 一 些 属性 。 第 一 个 属性 是 
层次 性 ， 即 树 是 按 层 级 构建 的 ， 越 笼统 就 越 靠近 顶部 ， 越 具体 则 越 靠 近 底部 。 在 图 6-1 中 ， 顶 层 
是 界 ， 下 一 层 (上 一 层 的 “ 子 节点 ”) 是 门 ， 然 后 是 纲 ， 依 此 类 推 。 但 不 管 这 棵 分 类 树 往 下 长 多 
深 ,所 有 的 节点 都 仍然 表示 动物 。 
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图 6-1 用 树 表示 一 些 常见 动物 的 分 类 


可 以 从 树 的 项 部 开始 , 沿 着 由 椭圆 和 箭头 构成 的 路 径 ， 一 直到 底部 。 在 树 的 每 一 层 ， 我 们 都 
可 以 提出 一 个 问题 ， 然 后 根据 答案 选择 路 径 。 比 如 ， 我 们 可 以 问 :“ 这 个 动物 是 属于 浴 索 动物 门 
还 是 节肢 动物 门 ? ”如果 答 案 是 “ 痊 索 动物 门 ”就 选 浓 索 动物 门 那 条 路 径 ; 再 问 : “是 哺乳 纲 吗 ? ” 
如 果 不 是 , 就 被 卡 住 了 ( 当然 仅 限于 在 这 个 简单 的 例子 中 )。 继续 发 问 :“ 这 个 哺乳 动物 是 属于 灵 
长 目 还 是 食肉 目 ” ”就 这 样 ， 我 们 可 以 沿 着 路 径直 达 树 的 底部 ， 找 到 常见 的 动物 名 。 

树 的 第 二 个 属性 是 , 一 个 节点 的 所 有 子 节 点 都 与 男 一 个 节点 的 所 有 子 节 点 无 关 。 比 如 ， 猫 属 
的 子 节 点 有 家 猫 ( 英文 名 为 Domestica ) 和 狮 。 家 蝇 属 的 子 节点 是 家 晶 , 其 英文 名 也 是 Domestica ， 
但 此 Domestica 非 彼 Domestica。 这 意味 着 可 以 变更 家 蝇 属 的 这 个 子 节点 ， 而 不 会 影响 猫 属 的 子 
节点 。 


第 三 个 属性 是 , 叶子 节点 都 是 独一无二 的 。 在 本 例 中 ,每 一 个 物种 都 对 应 唯一 的 一 条 从 树 根 
到 树叶 的 路 径 ， 比 如 动物 界 一 消 索 动物 门 一 哺乳 纲 一 食肉 目 一 猫 科 一 猫 属 一 家 猫 。 


男 一 个 常见 的 树 状 结构 是 文件 系统 。 在 文件 系统 中 ， 目 录 或 文件 夹 呈 树 状 结构 。 图 6-2 展示 
了 Unix 文件 系统 的 一 小 部 分 。 
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(ev i Users/ (var)) 
CC (nit d) postbx) bmiller/ Jmiller/ mysqy ) i log/ Dr 


图 6-2 Unix 文件 系统 的 一 小 部 分 


文件 系统 树 与 生物 分 类 树 有 很 多 共同 点 。 在 文件 系统 树 中 , 可 以 沿 着 一 条 路 径 从 根 直 达 任 何 
目录 。 这 条 路 径 能 唯一 标识 子 目 录 以 及 其 中 的 所 有 文件 。 树 的 层次 性 衍生 出 另 一 个 重要 属性 ， 即 
可 以 将 树 的 某 个 部 分 〈 称 作 子 树 ) 整体 移 到 另 一 个 位 置 ， 而 不 影响 下 面 的 层 。 比 如 ， 可 以 将 从 
etc/ 起 的 全 部 子 树 挪 到 usr 下 。 这 会 将 到 达 httpd/ 的 路 径 从 /etchttpd/ 变 成 asretc/httpd/， 但 不 会 影 
响 httpd 目录 下 的 内 容 或 子 节 点 。 


关于 树 的 最 后 一 个 例子 是 网 页 。 以 下 是 一 个 简单 网 页 的 HTML 代码 。 图 6-3 展示 了 该 网 页 用 
到 的 HTML 标签 所 对 应 的 树 。 


<html xmlns="http://www.w3.0org/1999/xhtml" 
Xml :lang="en" lang="en"> 
<head> 
<meta http-equiv="Content-Type" 
content="text/html; charset=utf-8" /> 
<title>simple</title> 
</head> 
<body> 
<hl>A simple web page</h1i> 
<ul> 
<li>List item one</1i> 
<li>List item two</1i> 
</ul> 
<h2><a href="http://www.ituring.com.cn">CS</a></h2> 


</body> 


</html> 


图 6-3 ”HTML 标签 对 应 的 树 
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HTML 源 代码 与 对 应 的 树 展示 了 男 一 种 层级 关系 。 树 的 每 一 层 对 应 HTML 标签 的 每 一 层 嵌 
套 。 在 源 代码 中 ， 第 一 个 标签 是 <html1>， 最 后 一 个 是 </html>。 其 余 的 标签 都 在 这 一 对 标签 之 
内 。 检 查 一 遍 会 发 现 ， 树 的 每 一 层 都 具备 这 种 仍 套 属性 


6.3 ”术语 及 定义 
在 看 了 一 些 树 的 例子 之 后 ， 现 在 来 正式 地 定义 树 及 其 构成 。 
节点 


节点 是 树 的 基础 部 分 。 它 可 以 有 自己 的 名 字 ， 我 们 称 作 “ 键 "。 节 点 也 可 以 带 有 附加 信息 ， 
我 们 称 作 “有 效 载荷 ”。 有 效 载 荷 信息 对 于 很 多 树 算法 来 说 不 是 重点 ， 但 它 常常 在 使 用 树 的 应 用 
中 很 重要 。 







































































边 

边 是 树 的 男 一 个 基础 部 分 。 wn 点 通过 一 条 边 相连 ， 表 示 它 们 之 间 存 在 关系 。 除 了 根 节点 
以 外 ， 其 他 每 个 节点 都 仅 有 一 条 入 边 ， 出 边 则 可 能 有 和 多 条 。 

根 节点 

根 节 点 是 树 中 唯一 没有 人 边 的 节点 。 在 图 6-2 中 ，/ 就 是 根 节点 。 

路 径 

路 径 是 由 边 连 接 的 有 序 节 点 列表 。 比 如 ,哺乳 纲 一 食肉 目 一 猫 科 一 猫 属 一 家 猫 就 是 一 条 路 径 。 

子 节点 

一 个 节点 通过 出 边 与 子 节 点 相连 。 在 图 6-2 中 ，log/、spooy 和 yp/ 都 是 var/ 的 子 节点 。 

父 节 点 

















一 个 节点 是 其 所 有 子 节点 的 父 节 点 。 在 图 6-2 中 ，var/ 是 log/、spool 和 yp/ 的 父 节 点 。 
兄弟 节点 
具有 同一 父 节 点 的 节点 互 称 为 兄弟 节点 。 文 件 系统 树 中 的 et/ 和 usr 就 是 兄弟 节点 。 














一 个 父 节点 及 其 所 有 后 代 的 节点 和 边 构 成 一 棵 子 树 。 

叶子 节点 

叶子 节点 没有 子 节点 。 比 如 ， 图 6-1 中 的 人 和 黑猩猩 都 是 叶子 节点 。 
层 数 








节点 4 的 层 数 是 从 根 节点 到 的 唯一 路 径 长 度 。 在 图 6-1 中 ,， 猫 属 的 层 数 是 5。 由 定义 可 知 ， 
根 节 点 的 层 数 是 0。 
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高 度 
树 的 高 度 是 其 中 节点 层 数 的 最 大 值 。 图 6-2 中 的 树 高 度 为 2。 
定义 基本 术语 后 ， 就 可 以 进一步 给 出 树 的 正式 定义 。 实 际 上 ,本 书 将 提供 两 种 定义 ， 其 中 一 
种 涉及 节点 和 边 ， 另 一 种 涉及 递归 。 你 在 后 面 会 看 到 ， 递 归 定 义 很 有 用 。 
定义 一 : 树 由 节点 及 连接 节点 的 边 构成 。 树 有 以 下 属性 : 
口 有 一 个 根 节点 ; 
口 除根 节点 外 ， 其 他 每 个 节点 都 与 其 唯一 的 父 节点 相连 
口 从 根 节点 到 其 他 每 个 节点 都 有 且 1 条 路 径 ; 
口 如 果 每 个 节点 最 多 有 两 个 子 节 点 ， 我 们 就 称 这 样 的 树 为 二 叉 树 。 


图 6-4 展示 了 一 棵 符合 定义 一 的 树 。 边 的 箭头 表示 连接 方向 。 































































































市 点 1 节点 2 

















点] | 子 节点 2 | 子 节点 3 子 节点 1 


子 节 ) 
节点 5 节点 6 


图 6-4 ”由 节点 和 边 构 成 的 树 


定义 二 : 一 棵 树 要 么 为 空 , 要 么 由 一 个 根 节 点 和 零 棵 或 多 棵 子 树 构成 , 子 树 本 身 也 是 一 棵 树 。 
每 棵 子 树 的 根 节点 通过 一 条 边 连 到 父 树 的 根 节点 。 图 6-5 展示 了 树 的 递归 定义 。 从 树 的 递归 定义 
可 知 ， 图 中 的 树 至 少 有 4 个 节点 ， 因 为 三 角形 代表 的 子 树 必 定 有 一 个 根 节 点 。 这 棵 树 或 许 有 更 多 
的 节点 ,但 必须 更 深入 地 查看 子 树 后 才能 确定 。 
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图 6-5 树 的 递归 定义 





6.4 ”实现 


根据 6.3 节 给 出 的 定义 ， 可 以 使 用 以 下 函数 创建 并 操作 二 叉 树 。 
口 BinaryTree() 创 建 一 个 二 义 树 实例 。 
口 getLeftchild() 返 回 当 前 节点 的 左 子 节点 所 对 应 的 二 又 树 。 
口 getRightchild() 返 回 当 前 节点 的 右 子 节点 所 对 应 的 二 叉 树 。 
口 setRootVal (val) 在 当前 节点 中 存储 参数 val 中 的 对 象 。 
D getRootVal () 返 回 当前 节点 存储 的 对 象 。 
口 insertLeft (val) 新 建 一 棵 二 又 树 ， 并 将 其 作为 当前 节点 的 左 子 节点 。 
口 insertRight (val) 新 建 一 棵 二 又 树 ， 并 将 其 作为 当前 节点 的 右 子 节点 。 
实现 树 的 关键 在 于 选择 一 个 好 的 内 部 存储 技巧 。 Python 提供 两 种 有 意思 的 方式 , 我 们 在 选择 
前 会 仔细 了 解 这 两 种 方式 。 第 一 种 称 作 “ 列 表 之 列表 ”， 第 二 种 称 作 “ 节 点 与 引用 ”。 


6.4.1 列表 之 列表 


用 “列表 之 列表 ”表示 树 时 ， 先 从 Python 的 列表 数据 结构 开始 ， 编 写 前 面 定义 的 函数 。 尽 
管 为 列表 编写 一 套 操作 的 接口 与 已 经 实现 的 其 他 抽象 数据 类 型 有 些 不 同 ,但 是 做 起 来 很 有 意思 ， 
因为 这 会 给 我 们 提供 一 个 简单 的 递归 数据 类 型 ， 供 我 们 直接 查看 和 检查 。 在 “列表 之 列表 ”的 树 
中 , 我 们 将 根 节 点 的 值 作为 列表 的 第 一 个 元 素 ; 第 二 个 元 素 是 代表 左 子 树 的 列表 ; 第 三 个 元 素 是 
代表 右 子 树 的 列表 。 要 理解 这 个 存储 技巧 ， 来 看 一 个 例子 。 图 6-6 展示 了 一 棵 简单 的 树 及 其 对 应 
的 列表 实现 。 
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Ca ) myTree = ['a'， # 根 节点 
['b'，# 左 子 树 








(a) 一 棵 简单 的 树 (b) 对 应 的 列表 实现 
图 6-6 树 的 “列表 之 列表 ”表示 法 


注意 ， 可 以 通过 标准 的 列表 切片 操作 访问 子 树 。 树 的 根 节点 是 myTree[0] ， 左 子 树 是 
myTree[1] ， 布 子 树 是 myTree[2]。 以 下 会 话 展示 了 如 何 使 用 列表 创建 树 。 一 旦 创建 完成 ， 就 
可 以 访问 它 的 根 节点 、 左 子 树 和 右 子 树 。“ 列 表 之 列表 ”表示 法 有 个 很 好 的 性 质 ， 那 就 是 表示 子 
树 的 列表 结构 符合 树 的 定义 , 这 样 的 结构 是 递归 的 ! 由 一 个 根 节点 和 两 个 空 列表 构成 的 子 树 是 一 
个 叶子 节点 。 还 有 一 个 很 好 的 性 质 , 那 就 是 这 种 表示 法 可 以 推广 到 有 很 多 子 树 的 情况 。 如 果树 不 
是 二 又 树 ， 则 多 一 棵 子 树 只 是 多 一 个 列表 。 


SS MyTree ela. [ba sd, Dz, Dy Le Es CJ N 
[有 ] 































































































>>> myTree 
= Be Ue 

"ey sy 

>>> myTreel[ll1 
Sb ol Tl ssl ds Ey Cd be 

>>> myTreel[l0 

,al 

>>> ImyTree[2 


(oe Ea de ee a i Wh le le] 

接 下 来 提供 一 些 便于 将 列表 作为 树 使 用 的 函数 ， 以 正式 定义 树 数 据 结 构 。 注 意 , 我 们 不 是 要 
定义 二 叉 树 类 ， 而 是 要 创建 可 用 于 标准 列表 的 函数 。 6 
代码 清单 6-1 列表 函数 BinaryTree 


出 def BinaryTree ( 工 ) : 
2 retUrn LE; [3 5] 












































BinaryTree 函数 构造 一 个 简单 的 列表 , 它 仅 有 一 个 根 节点 和 两 个 作为 子 节点 的 空 列表 ,如 
代码 清单 6-1 所 示 。 要 给 树 添加 左 子 树 , 需要 在 列表 的 第 二 个 位 置 加 入 一 个 新 列表 。 请 务必 当心 : 
如 果 列 表 的 第 二 个 位 置 上 已 经 有 内 容 了 , 我 们 要 保留 已 有 内 容 , 并 将 它 作为 新 列表 的 左 子 树 。 代 
码 清单 6-2 给 出 了 插入 左 子 树 的 Python 代码 。 
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代码 清单 6-2 插入 左 子 树 

1 def insertLeft (root, newBranch): 

2 t= TOOt..Bop(1) 

3 Lf “Lery(t) S13 

4 root.insert(1, [newBranch, t, []]) 
5 else: 

6 root.insert(1, [newBranch, [], []]) 
ys return root 





在 插入 左 子 树 时 ， 先 获取 当前 的 左 子 树 所 对 应 的 列表 ( 可 能 为 空 )， 然 后 加 入 新 的 左 子 树 ， 
将 旧 的 左 子 树 作为 新 节点 的 左 子 树 。 这 样 一 来 ,就 可 以 在 树 的 任意 位 置 插入 新 节点 。 
insertRight 与 insertLeft 类 似 ， 如 代码 清单 6-3 所 示 。 


代码 清单 6-3 ”插入 右 子 树 




















J def insertRight (root, newBranch): 

2 tl Oot BoBt2) 

3 if len(t) > 1: 

4 root.insert (2, [newBranch, [], t]) 
5 else: 

6 root.insert (2, [newBranch, [], []] 
7 return root 











为 了 完整 地 创建 树 的 函数 集 ， 让 我们 来 编写 一 些 访 问 函 数 ， 用 于 读 写 根 方 点 与 左右 子 树 ， 如 
代码 清单 6-4 所 示 。 
代码 清单 6-4” 树 的 访问 函数 


def getRootVal (root): 
return root[0] 

















def setRootVal (root, newVal): 
root[0] = newVal 


def getLeftChild (root): 
return root[1] 








0 def getRightChild(root): 
亚 return root[2] 











6-7 中 的 Python 会 话 执行 了 刚 创 建 的 树 函 数 。 请 自己 输入 代码 试 试 。 在 章 末 的 练习 中 , 你 
需要 画 出 这 些 调用 得 到 的 树 状 结构 。 
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6.4.2 节点 与 引用 
树 的 第 二 种 表示 法 是 利 月 





r = BinaryTree(3) 


insertLeft (r,4) 


insertRight (r,6)} 
Dt dy ll 


insertRight (r,7) 





Se [ds el 
=getLeftcChild(r) 


4, [], ]， ] 
和 


下 





9, [4, 2 





insertLeft {1, 了 
11, [4，[]， ] ， 


基 : 











9, [11, [4, 





]， [1] 


图 6-7 











getRightchild(getRightchild(r})) 


图 6-8 所 示 的 结构 。 























展示 基本 树 函 数 的 Python 会 话 
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图 6-8 








“节点 与 引用 ”表示 法 的 简单 示例 





旧 节 点 与 引用 。 我 们 将 定义 一 个 类 , 其 中 有 根 节点 和 左右 子 树 的 属性 。 
这 种 表示 法 遵循 面向 对 象 编程 范式 ， 所 以 本 章 后 续 内 容 会 采用 这 种 表示 法 。 
采用 “节点 与 引用 ”表示 法 时 ， 可 以 将 树 想象 成 如 
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首先 定义 一 个 简单 的 类 ， 如 代码 清单 6-5 所 示 。“ 节 点 与 引用 ”表示 法 的 要 点 是 ,属性 left 
和 right 会 指向 BinaryTree 类 的 其 他 实例 。 举 例 来 说 ， 在 向 树 中 插入 新 的 左 子 树 时 ， 我 们 会 
创建 男 一 个 BinaryTree 实例 ， 并 将 根 节点 的 self .leftchilg 改 为 指向 新 树 。 


代码 清单 6-5 BinaryTree 类 














J class BinaryTree: 

2 def __init__(self, rootObj): 
3 self.key = rootObj 

4 self.leftChild = None 

3 self.rightChild = None 





在 代码 清单 6-5 中 ,构造 方法 接受 一 个 对 象 ， 并 将 其 存储 到 根 节点 中 。 正 如 能 在 列表 中 存储 
任何 对 象 , 根 节点 对 象 也 可 以 成 为 任何 对 象 的 引用 。 就 之 前 的 例子 而 言 , 我 们 将 节点 名 作为 根 的 
值 存储 。 采 用 “节点 与 引用 ”法 表示 图 6-8 中 的 树 ， 将 创建 6 个 BinaryTree 实例 。 

下 面 看 看 基于 根 节 点 构建 树 所 需要 的 函数 ,为 了 给 树 添加 左 子 树 , 我们 新 建 一 个 二 又 树 对 象 ， 
将 根 节点 的 left 属性 指向 新 对 象 。 代 码 清 单 6-6 给 出 了 insertLeft 函数 的 代码 。 


代码 清单 6-6 ”插入 左 子 市 点 











于 def insertLeft (self, newNode): 

2 if self.leftChild == None: 

3 self.leftChild = BinaryTree (newNode) 
4 else: 

5 t = BinaryTree (newNode) 

6 EA Left SSelf. LEftonild 

7 总 车 下 EftCHLLG Et 














在 搬入 左 子 树 时 ， 必 须 考 虑 两 种 情况 。 第 一 种 情况 是 原本 没有 左 子 节点 。 此 时 ， 只 需 往 树 中 
添加 一 个 节点 即 可 。 第 二 种 情况 是 已 经 存在 左 子 节 点 。 此 时 , 插入 一 个 节点 ,并 将 已 有 的 左 子 广 
点 降 一 层 。 代 码 清单 6-6 中 的 else 语句 处 理 的 就 是 第 二 种 情况 。 

insertRight 函数 也 要 考虑 相应 的 两 种 情况 : 要 么 原本 没有 右 子 节点 ， 要 么 必须 在 根 节 点 
和 已 有 的 右 子 节点 之 间 插 入 一 个 节点 。 代 码 清单 6-7 给 出 了 insertRight 函数 的 代码 。 


代码 清单 6-7 ”插入 右 子 节点 



































4 def insertRight (self, newNode): 

和 2 if self.rightChild == None: 

3 self.rightChild = BinaryTree (newNode) 
4 else: 

by t = BinaryTree (newNode) 

6 t.right = self.rightChild 

J self.rightChild = t 





为 了 完成 对 二 叉 树 数据 结构 的 定义 , 我 们 来 编写 一 些 访问 左右 子 节点 与 根 节 点 的 函数 ， 如 代 
码 清单 6-8 所 示 。 
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代码 清单 6-8 二叉树 的 访问 函数 








def getRightChild(self): 

多 return self.rightChild 
3 

4 def getLeftChild(self): 

5 return self.leftChild 
6 

7 def setRootVal (self, obj): 
8 self.key = obj 

9 

10 def getRootVal (self): 

11 return self.key 











有 了 创建 与 操作 二 又 树 的 所 有 代码 , 现在 用 它们 来 进一步 了 解 结构 。 我 们 创建 一 棵 简单 的 树 ， 
并 为 根 节点 a 添加 子 节 点 b 和 c。 下 面 的 Python 会 话 创建 了 这 棵 树 ,并 查看 key、left 和 right 
中 存储 的 值 。 注意 ， 根 节点 的 左右 子 节点 本 身 都 是 BinaryTree 类 的 实例 。 正如 递归 定义 所 言 ， 
二 义 树 的 所 有 子 树 也 都 是 二 又 树 。 


>>> from pythonds.trees import BinaryTree 
>>> r = BinaryTree('a') 

>>> r.getRootVal() 

Ts 
>>> print (r.getLeftChild!() 

None 
>>> r.insertLeft('b') 

>>> print (r.getLeftChild!() 

<_ main .BinaryTree instance at 0x6b238> 
>>> print (r.getLeftChild() .getRootVal()) 

b 
>>> r.insertRight ('c') 

>>> print (r.getRightChild()) 

<_ main .BinaryTree instance at 0x6b9e0> 
>>> print (r.getRightChild() .getRootVal()) 
el 
>>> r.getRightChild() .setRootVall('hello') 
>>> print (r.getRightChild() .getRootVal()) 
hello 

> 












































6.5 二叉树 的 应 用 


6.5.1 解析 树 


树 的 实现 已 经 齐全 了 , 现在 来 看 看 如 何 用 树 解 决 一 些 实际 问题 。 本 节 介 绍 解析 树 , 可 以 用 它 
来 表示 现实 世界 中 像 句 子 ( 如 图 6-9 所 示 ) 或 数学 表达 式 这 样 的 构造 。 
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图 6-9 一 个 简单 句子 的 解析 树 











图 6-9 展示 了 一 个 简单 句子 的 层次 结构 。 用 树 状 结构 表示 句子 让 我 们 可 以 使 用 子 树 处 理 句 子 
的 独立 部 分 。 

我 们 也 可 以 将 ((7 + 3) * (5 - 2)) 这 样 的 数学 表达 式 表示 成 解析 树 ， 如 图 6-10 所 示 。 这 
是 完全 括号 表达 式 , 乘法 的 优先 级 高 于 加 法 和 减法 , 但 因为 有 括号 , 所 以 在 做 乘法 前 必须 先 做 括 
号 内 的 加 法 和 减法 。 树 的 层次 性 有 助 于 理解 整个 表达 式 的 计算 次 序 。 在 计算 顶层 的 乘法 前 ， 必 须 
先 计算 子 树 中 的 加 法 和 减法 。 加 法 〈 左 子 树 ) 的 结果 是 10, 减法 ( 右 子 树 ) 的 结果 是 3。 利 用 树 
的 层次 结构 , 在 计算 完 子 树 的 表达 式 后 ， 只 需 用 一 个 节点 代替 整 棵 子 树 即 可 。 应 用 这 个 替换 过 程 


后 ， 便 得 到 如 图 6-11 所 示 的 简化 树 。 


图 6-10 ((7 + 3) * (5 - 2)) 的 解析 树 
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图 6-11 ((7 + 3) * (5 - 2)) 的 简化 解析 树 
本 节 的 剩余 部 分 将 仔细 考察 解析 树 ， 重 点 如 下 : 
口 如 何 根据 完全 括号 表达 式 构 建 解析 树 ; 
口 如 何 计算 解析 树 中 的 表达 式 ; 
口 如 何 将 解析 树 还 原 成 最 初 的 数学 表达 式 。 

构建 解析 树 的 第 一 步 是 将 表达 式 字符 串 拆 分 成 标记 列表 。 需 要 考虑 4 种 标记 : 左 括号 、 右 括 
号 、 运 算 符 和 操作 数 。 我 们 知道 , 左 括号 代表 新 表达 式 的 起 点 ， 所 以 应 该 创建 一 棵 对 应 该 表达 式 
的 新 树 。 反 之 ， 遇 到 右 括号 则 意味 着 到 达 该 表达 式 的 终点 。 我 们 也 知道 ， 操 作 数 既是 叶子 节点 ， 
也 是 其 运算 符 的 子 节点 。 此 外 ， 每 个 运算 符 都 有 左右 子 节点 。 

有 了 上 述 信息 ， 便 可 以 定义 以 下 4 条 规则 












































(1) 如 果 当 前 标记 是 (， 就 为 当前 节点 添加 一 个 左 子 节点 ， 并 下 沉 至 该 子 节点 ; 
(2) 如 果 当 前 标记 在 列表 [+ -0 中， 就 将 当前 节点 的 值 设 为 当前 标记 对 应 


的 运算 符 ; 为 当前 节点 添加 一 个 右 子 节点 ， 并 下 沉 至 该 子 节 点 ; 
(3) 如 果 当 前 标记 是 数字 ， 就 将 当前 节点 的 值 设 为 这 个 数 并 返回 至 父 节 点 ; 
(4) 如 果 当 前 标记 是 ) ， 就 跳 到 当前 节点 的 父 节 点 




















编写 人 我 们 先 通过 一 个 例子 来 理解 上 述 规则 。 将 表达 式 (3 + (4 * 5) ) 拆 分 6 





成 标记 列表 [， 3 34 04 57 5， ，')']。 起 初 ， 解析 树 只 有 一 个 
空 的 根 节 点 ， 站 宙 不 机 后 风 凶 解析 树 的 结构 和 内 容 逐 渐 充 实 ， 如 图 6-12 所 示 。 








(a) (b) (9) (d) 


(©) (9 (g) (h) 
图 6-12 一 步 步 地 构建 解析 树 
图 6-12 为 例 ， 我 们 来 一 步 步 地 构建 解析 树 。 

(a) 创建 一 棵 空 树 。 

(b) 读 和 人 第 一 个 标记 (。 根 据 规则 1， 为 根 节点 添加 一 个 左 子 节 点 。 

(0) 读 入 下 一 个 标记 3。 根 据 规则 3， 将 当前 节点 的 值 设 为 3， 并 回 到 父 节 点 。 

(d) 读 入 下 一 个 标记 +。 根 据 规则 2， 将 当前 节点 的 值 设 为 +， 并 添加 一 个 右 子 节点 。 新 节点 
成 为 当前 节点 。 

(e) 读 入 下 一 个 标记 (。 根 据 规则 1， 为 当前 节点 添加 一 个 左 子 节点 ， 并 将 其 作为 当前 节点 。 

(DD 读 入 下 一 个 标记 4。 根 据 规则 3， 将 当前 节点 的 值 设 为 4， 并 回 到 父 节 点 。 

(g) 读 入 下 一 个 标记 *。 根 据 规则 2， 将 当前 节点 的 值 设 为 *， 并 添加 一 个 右 子 节点 。 新 节点 
成 为 当前 节点 。 

人) 读 入 下 一 个 标记 5。 根 据 规则 3， 将 当前 节点 的 值 设 为 5， 并 回 到 父 节 点 。 

Q) 读 入 下 一 个 标记 ) 。 根 据 规则 4， 将 * 的 父 厂 点 作为 当前 证 点 。 

0) 读 入 下 一 个 标记 ) 。 根 据 规则 4， 将 + 的 父 节 点 作为 当前 节点 。 因 为 + 没有 父 节点 ， 所 以 工 
作 完 成 。 

本 例 表 明 ,在 构建 解析 树 的 过 程 中 ,需要 追踪 当前 节点 及 其 父 节 点 。 可 以 通过 getLeftchilg 
与 getRightchild 获取 子 节 点 , 但 如 何 追 踪 父 节点 呢 ? 一 个 简单 的 办 法 就 是 在 遍历 这 棵 树 时 使 
用 栈 记录 父 节 点 。 每 当 要 下 沉 至 当前 节点 的 子 节点 时 ,， 先 将 当前 节点 压 到 栈 中 。 当 要 返回 到 当前 








过 
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市 点 的 父 节点 时 ， 就 将 父 节 点 从 栈 中 弹出 来 。 
利用 前 面 描述 的 规则 以 及 stack 和 BinaryTree， 就 可 以 编写 创建 解析 树 的 Python 函数 。 
代码 清单 6-9 给 出 了 解析 树 构 建 器 的 代码 。 


代码 清单 6-9 ”解析 树 构 建 器 





from pythonds.basic import Stack 
from pythonds.trees import BinaryTree 


1 

起 

3 

4 def buildParseTree (fpexp): 
5 fplist = fpexp.split() 
6 pstack = Stack() 

7 eTree = BinaryTree('') 
8 pstack.push (eTree) 

9 











currentTree = eTree 
10 for i in fplist: 
生计 i 半 二 二 站 
12 currentTree.insertLeft('') 
13 pstack.push(currentTree) 
14 currentTree = currentTree.getLeftChild!() 
15 elif i not in '+-*/)': 
.6 currentTree.setRootVal (eval (i)) 
Bg parent = pStack.pop() 
18 currentTree = parent 
19 1 一 / 
20 currentTree.setRootVal (i) 
2 秆 currentTree.insertRight ('') 
22 pStack.push(currentTree) 
23 currentTree = currentTree.getRightChild() 
24 SLi i 
25 currentTree = pStack.pop!() 
26 else: 
27 raise ValueError ("Unknown Operator: " + i) 
28 return eTree 








在 代码 清单 6-9 中 , 第 11、15、19 和 24 行 的 if 语句 体现 了 构建 解析 树 的 4 条 规则 ， 其 中 
每 条 语句 都 通过 调用 BinaryTree 和 Stack 的 方法 实现 了 前 面 描述 的 规则 。 这 个 函数 中 唯一 的 
错误 检查 在 else 从句 中 ， 如 果 遇 到 一 个 不 能 识别 的 标记 ， 就 抛 出 一 个 valueError 异常 。 


有 了 一 棵 解析 树 之 后 , 我 们 能 对 它 做 些 什么 呢 ? 作为 第 一 个 例子 , 我 们 可 以 写 一 个 函数 计算 
解析 树 ， 并 返回 计算 结果 。 要 写 这 个 函数 ， 我 们 将 利用 树 的 层次 性 。 针 对 图 6-10 中 的 解析 树 ， 
可 以 用 图 6-11 中 的 简化 解析 树 替 换 。 由 此 可 见 ， 可 以 写 一 个 算法 ， 通 过 递归 计算 每 棵 子 树 得 到 
整 棵 解析 树 的 结果 。 

和 之 前 编写 递归 函数 一 样 , 设计 递归 计算 函数 要 从 确定 基本 情况 开始 。 就 针对 树 进 行 操作 的 
递归 算法 而 言 , 一 个 很 自然 的 基本 情况 就 是 检查 叶子 节点 。 解 析 树 的 叶子 节点 必定 是 操作 数 。 由 
于 像 整数 和 浮 点 数 这 样 的 数值 对 象 不 需要 进一步 翻译 , 因此 evaluate 函数 可 以 直接 返回 叶子 节 
点 的 值 ,为 了 向 基本 情况 靠近 ,算法 将 执行 递归 步骤 , 即 对 当前 节点 的 左右 子 节点 调用 evaluate 
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函数 。 递 归 调 用 可 以 有 效 地 沿 着 各 条 边 往 叶子 节点 靠近 。 

若 要 结合 两 个 递归 调用 的 结果 ， 只 需 将 父 节点 中 存储 的 运算 符 应 用 于 子 节点 的 计算 结果 即 
可 。 从 图 6-11 中 可 知 ， 根 节点 的 两 个 子 节点 的 计算 结果 就 是 它们 自身 ， 即 10 和 3。 应 用 乘 号 ， 
得 到 最 后 的 结果 30。 

递归 函数 evaluate 的 实现 如 代码 清单 6-10 所 示 。 首 先 ， 获 取 指 向 当前 节点 的 左右 子 节点 
的 引用 。 如 果 左 右 子 节 点 的 值 都 是 None， 就 说 明 当 前 节点 确实 是 叶子 节点 。 第 7 行 执 行 这 项 检 















































查 。 如 果 当 前 节点 不 是 叶子 节点 ， 则 查看 当前 节点 中 存储 的 运算 符 ， 并 将 其 应 用 于 左右 子 节 点 的 
递归 计算 结 


代码 清单 6-10 ”计算 二 又 解析 树 的 递归 函数 





于 def evaluate(parseTree): 

2 opers = {'+':Ooperator.add, '-':operator.sub, 

3 '*!;operator.mul, '/':operator.truediv} 
4 leftC = parseTree.getLeftChild!() 

与 rightC = ParseTree.getRightCchild() 

6 

7 if leftC and rightc: 

8 fn = opersl[lparseTree.getRootVal() 

9 return fn(evaluate(leftC), evaluate (rightC)) 
10 else: 

jh return parseTree.getRootVal () 





我 们 使 用 具有 键 +、- 、* 和 /的 字典 实现 。 字 典 中 存储 的 值 是 operator 模块 的 函数 。 该 模 
块 给 我 们 提供 了 和 常用 运算 符 的 函数 版 本 。 在 字典 中 查询 运算 符 时 ， 对 应 的 函数 对 象 被 取出 。 既 然 
取出 的 对 象 是 函数 ， 就 可 以 用 普通 的 方式 function(paraml，param2) 调 用 。 因 此 ， 
opers['+'] (2，2) 等 价 于 operator.add(2，2)。 


最 后 ,让 我 们 通过 图 6-12 中 的 解析 树 构 建 过 程 来 理解 evaluate 函数 ,第 一 次 调用 evaluate 
函数 时 ， 将 整 棵 树 的 根 节点 作为 参数 parseTree 传人 。 然 后 ， 获 取 指 向 左右 子 节点 的 引用 ， 检 
查 它们 是 否 存 在 。 第 9 行进 行 递归 调用 。 从 查询 根 节点 的 运算 符 开 始 ， 该 运算 符 是 + ， 对 应 
operator.add 国 数 ， 要 传人 两 个 参数 。 和 普通 的 Python 函数 调用 一 样 ，Python 做 的 第 一 件 事 
是 计算 入 参 的 值 。 本 例 中 , 两 个 人 参 都 是 对 evaluate 函数 的 递归 调用 。 由 于 入 参 的 计算 顺序 是 
从 左 到 右 ， 因 此 第 一 次 递归 调用 是 在 左边 。 对 左 子 树 递 归 调 用 evaluate 函数 ,发 现 节 点 没有 左 
右 子 节点 , 所 以 这 是 一 个 叶子 节点 。 处 于 叶子 节点 时 , 只 需 返 回 叶 子 节点 的 值 作 为 计算 结果 即 可 。 
本 例 中 ， 返 回 整数 3。 

至 此 ， 我 们 已 经 为 顶层 的 operator.add 调用 计算 出 一 个 参数 的 值 了 ， 但 还 没完 。 继续 从 
左 到 右 的 参数 计算 过 程 ， 现 在 进行 一 个 递归 调用 ,计算 根 节点 的 右 子 节点 。 我 们 发 现 , 该 节点 不 
仅 有 左 子 节 点 ， 还 有 右 子 节点 ， 所 以 检查 节点 存储 的 运算 符 一 一 是 *， 将 左右 子 节 点 作为 参数 调 
用 函数 。 这 时 可 以 看 到 ， 两 个 调用 都 已 到 达 叶 子 节 点 ， 计 算 结 果 分 别 是 4 和 5$。 算 出 参数 之 后 ， 
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返回 operator .mul(4，5) 的 结果 。 至 此 ， 我 们 已 经 算出 了 顶层 运算 符 (+ ) 的 操作 数 ， 剩 下 
的 工作 就 是 完成 对 operator .adda(3，20) 的 调用 。 因 此 ， 表 达 式 (3 + (4 * 5) ) 的 计算 结果 就 
征 23。 





GD 

















6.5.2 ” 树 的 遍历 


我 们 已 经 了 解 了 树 的 基本 功能 , 现在 是 时 候 看 看 一 些 附加 的 使 用 模式 了 。 这 些 使 用 模式 可 以 
按 市 点 的 访问 方式 分 为 3 种 。 我 们 将 对 所 有 节点 的 访问 称 为 “遍历 ”， 共 有 3 种 遍历 方式 ,分别 
为 前 序 遍历 、 中 序 遍 历 和 后 序 遍 历 。 接 下 来 ,我 们 先 仔细 地 定义 这 3 种 遍历 方式 ,然后 通过 一 些 
例子 看 看 它们 的 用 法 。 
























































前 序 遍 历 
在 前 序 遍 历 中 ， 先 访问 根 节点 ， 然 后 递归 地 前 序 遍 历 左 子 树 ， 最 后 递归 地 前 序 遍 历 右 子 树 。 
中 序 遍 历 
在 中 序 遍 历 中 ， 先 递归 地 中 序 遍 历 左 子 树 ， 然 后 访问 根 节 点 ， 最 后 递归 地 中 序 遍 历 右 子 树 。 
后 序 遍 历 
在 后 序 遍 历 中 ， 先 递归 地 后 序 遍 历 右 子 树 ， 然 后 递归 地 后 序 遍历 左 子 树 ， 最 后 访问 根 节点 。 














让 我 们 通过 几 个 例子 来 理解 这 3 种 遍历 方式 。 首 先 看 看 前 序 遍 历 。 我 们 将 一 本 书 的 内 容 结构 
表示 为 一 棵 树 , 整 本 书 是 根 节点 , 每 一 章 是 根 节点 的 子 节 点 , 每 一 章 中 的 每 一 他 是 这 章 的 子 节点 ， 
每 小 节 又 是 这 节 的 子 节点 ， 依 此 类 推 。 图 6-13 展示 了 一 本 书 的 树 状 结构 ， 它 包含 两 章 。 注 意 ， 
遍历 算法 对 每 个 节点 的 子 节点 数 没 有 要 求 ， 但 本 例 只 针对 二 又 树 。 





























图 6-13 ”一 本 书 的 树 状 结 松 
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假设 我 们 从 前 往 后 阅读 这 本 书 , 那么 阅读 顺序 就 符合 前 序 遍 历 的 次 序 。 从 根 节 点 “ 书 ” 开始， 
遵循 前 序 遍历 指令 ， 对 左 子 节点 “第 1 章 ” 递 归 调 用 preorder 函数 。 然 后 ,对 “第 1 章 ” 的 左 
子 节点 递归 调用 preorder 函数 , 得 到 节点 “1.1 节 ”。 由 于 该 节点 没有 子 节点 , 因此 不 必 再 进行 
递归 调用 。 沿 着 树 回 到 节点 “第 1 章 ”， 接 下 来 访问 它 的 右 子 节点 ， 即 “1.2 节 ”。 和 前 面 一 样 ， 
先 访问 左 子 节 点 “1.2.1 节 ”， 然 后 访问 右 子 节点 “1.2.2 节 ”。 访问 完 “1.2 市 ”之 后 ， 回 到 “第 1 
章 ”。 接 下 来 ， 回 到 根 节 点 ， 以 同样 的 方式 访问 节点 “第 2 章 ”。 

遍历 树 的 代码 格外 简洁 ， 这 主要 是 因为 遍历 是 递归 的 。 


你 可 能 会 想 , 前 序 遍 历 算法 的 最 佳 实现 方式 是 什么 呢 ?” 是 一 个 将 树 用 作 数 据 结构 的 函数 , 还 
是 树 本 身 的 一 个 方法 ? 代码 清单 6-11 给 出 了 前 序 遍 历 算法 的 外 部 函数 版 本 ,该 限 数 将 二 又 树 作 
为 参数 ， 其 代码 尤为 简洁 ， 这 是 因为 算法 的 基本 情况 仅仅 是 检查 树 是 否 存在 。 如 果 参 数 tree 是 
None， 了 水 数 直 接 返 回 。 


代码 清单 6-11 将 前 序 遍 历 算法 实现 为 外 部 函数 
下 def preorder (tree): 
if tree: 








































































































2 

3 print (tree.getRootVal ()) 

4 preorder (tree.getLeftChild()) 
preorder (tree.getRightChild()) 





我 们 也 可 以 将 preorder 实现 为 BinaryTree 类 的 方法 ， 如 代码 清单 6-12 所 示 。 请 留意 将 
代码 从 外 部 移 到 内 部 后 有 何 变化 。 通 常 来 说 ， 不 仅 需要 用 self 代替 tree， 还 需要 修改 基本 情 
况 。 内 部 方法 必须 在 递归 调用 preorder 前 ， 检 查 左右 子 节点 是 否 存在 。 


代码 清单 6-12 ”将 前 序 遍 历 算法 实现 为 BinaryTree 类 的 方法 




















工 def preorder (self): 

多 print (self.key) 

3 if self.leftChilgd: 

4 self.left.preorder() 
5 if self.rightChild: 

6 self.right .preorder () 

















哪 种 实现 方式 更 好 呢 ? 在 本 例 中 , 将 preorder 实现 为 外 部 函数 可 能 是 更 好 的 选择 。 原因 在 
于 ， 很 少 会 仅 执 行 遍 历 操 作 , 在 大 多 数 情况 下 ， 还 要 通过 基本 的 遍历 模式 实现 别 的 目标 。 在 下 一 
个 例子 中 ， 我 们 就 会 通过 后 序 遍 历来 计算 解析 树 。 所 以 ， 我 们 在 此 采用 外 部 函数 版 本 。 

在 代码 清单 6-13 中 , 后 序 遍 历 函 数 postorder 与 前 序 遍 历 困 数 preorder 几乎 相同 , 只 不 
过 对 print 的 调用 被 移 到 了 也 数 的 末尾 。 


代码 清单 6-13 ”后 序 遍 历 函数 


1 def postorder (tree): 
2 if tree != None: 
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3 postorder (tree.getLeftChild()) 
4 postorder (tree.getRightChild()) 
号 print (tree.getRootVal () ) 








我 们 已 经 见识 过 后 序 遍 历 的 一 个 常见 用 途 , 那 就 是 计算 解析 树 。 回 顾 代 码 清单 6-10, 我 们 所 
做 的 就 是 先 计算 左 子 树 , 再 计算 右 子 树 , 最 后 通过 根 节 点 运算 符 的 函数 调用 将 两 个 结果 结合 起 来 。 
假设 二 义 树 只 存储 一 个 表达 式 的 数据 。 让 我 们 来 重 写 计算 函数 ， 使 之 更 接近 于 代码 清单 6-13 中 
的 后 序 遍 历 函 数 。 


代码 清单 6-14 后 序 求 值 函数 


def postordereval (tree): 























有 opers = {'+':Ooperator.add, '-':operator.sub, 

3 '*'!:;operator.mul, '/':operator.truediv} 
4 resl = None 

5 res2 = None 

6 if tree: 

7 resl = postordereval (tree.getLeftChild()) 

8 res2 = postordereval (tree.getRightChild!() 

9 if resl and res2: 

10 return opers[tree.getRootVal()] (resl, res2) 
于 else: 

12 return tree.getRootVal() 





注意 , 代码 清单 6-14 与 代码 清单 6-13 在 形式 上 很 相似 , 只 不 过 求 值 函数 最 后 不 是 打印 节点 ， 
而 是 返回 节点 。 这 样 一 来 ， 就 可 以 保存 从 第 7 行 和 第 8 行 的 递归 调用 返回 的 值 ， 然 后 在 第 10 行 
使 用 这 些 值 和 运算 符 进行 计算 。 

最 后 来 了 解 中 序 遍历 。 中 序 人 遍历 的 访问 顺序 是 左 子 树 、 根 入 点 、 右 子 树 。 代 码 清单 6-15 给 
出 了 中 序 遍 历 函 数 的 代码 。 注意 , 3 个 遍历 函数 的 区 别 仅 在 于 print 语句 与 递归 调用 语句 的 相对 
位 置 。 





















































代码 清单 6-15 “中 序 遍 历 函 数 6 
1 def inorder (tree): 

if tree != None: 

3 inorder (tree.getLeftChild()) 

4 print (tree.getRootVal ()) 

5 inorder (tree.getRightChild()) 








通过 中 序 遍 历 解析 树 ， 可 以 还 原 不 带 括号 的 表达 式 。 接 下 来 修改 中 序 遍 历 算法 ,以 得 到 完全 
括号 表达 式 。 唯 一 要 做 的 修改 是 : 在 递归 调用 左 子 树 前 打印 一 个 左 括号 ,在 递归 调用 右 子 树 后 打 
印 一 个 右 插 号。 代码 清单 6-16 是 修改 后 的 函数 。 


代码 清单 6-16 ”修改 后 的 中 序 遍 历 函 数 ， 它 能 还 原 完 全 括号 表达 式 


和 def printexp (tree): 
2 SV “= 
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3 if tree: 
4 sVal = '(' + printexp (tree.getLeftChild!() 
5 sVal = sVal + str(tree.getRootVal() 
6 sVal = sVal + printexp (tree.getRightChild()) + ')' 
7 return sVal 





以 下 Python 会 话 展示 了 printexp 和 postordereval 的 用 法 。 


from pythonds.trees import BinaryTree 


>>> 
>>> 
>>> 
>>> 
>>> 
>>> 
>>> 
>>> 
>>> 
(((4 


> 


x 


x 
1 
] 
1 
x 


= BinaryTree('*') 


.insertLeft('+') 


= x.getLeftChild!() 
insertLeft (4) 


.insertRight (5) 
.insertRight (7) 


print (printexp (x)) 


) 


9) (7 


>>> print (postordereval (x)) 


63 
>>> 


ie, 
注意 ， 


的 。 在 章 末 的 练习 中 ， 请 修改 printexp 函数 ， 移 除 这 些 括号 。 


6.6 ”利用 二 叉 堆 实现 优先 级 队列 
第 3 章 介绍 过 队列 这 一 先进 先 出 的 数据 结构 。 队 列 有 一 个 重要 的 变 体 ， 叫 作 优先 级 队列 。 和 


队列 一 样 ， 优先 级 队列 从 头 部 移 除 元 素 , 不 过 元 素 的 逻辑 顺序 是 





printexp 图 数 给 每 个 数字 都 加 上 了 括号 。 尽 管 不 能 算 错 误 ,， 但 这 些 括 





























元 素 在 最 前 ,优先 级 最 低 的 元 素 在 最 后 。 因 此 ， 当 一 个 元 素 人 队 时 ， 它 可 能 


列 的 头 部 。 你 在 第 7 章 会 看 到 




















由 
年 
党 
并 


多 余 





由 优先 级 决定 的 。 优 先 级 最 高 的 


[ 接 被 移 到 优先 级 队 





|， 对 于 一 些 图 算法 来 说 ， 优 先 级 队列 是 一 个 有 用 的 数据 结构 。 





你 或 许可 以 想到 一 些 使 用 排序 函数 和 列表 实现 优先 级 队列 的 简单 方法 。 但 是 , 就 时 间 复 杂 度 


而 言 ， 列 表 的 捐 














入 操作 是 O(n) ， 排 序 操作 是 O(nlogn) 。 其 实 ， 效率 可 以 更 高 。 实 现 优先 级 队列 


的 经 典 方法 是 使 用 叫 作 二 叉 堆 的 数据 结构 。 二 叉 堆 的 入 队 操作 和 出 队 操 作 均 可 达到 O(logn) 。 


二 又 堆 学 起 来 很 有 意思 ， 











本 节 将 实 





它 画 出 来 很 像 一 棵 树 , 但 实现 时 只 用 一 个 列表 作为 内 部 表示 。 二 叉 














现 最 小 堆 ， 并 将 最 大 堆 的 实现 留 作 练 习 。 


6.6.1 二 又 堆 的 操作 
我 们 将 实现 以 下 基本 的 二 叉 堆 方 法 。 





口 BinaryHeap () 新 建 一 个 空 的 二 叉 堆 。 
口 insert (k) 往 堆 中 加 入 一 个 新 元 素 。 




















有 两 个 常见 的 变 体 : 最 小 堆 〈 最 小 的 元 素 一 直 在 队 首 ) 与 最 大 堆 ( 最 大 的 元 素 一 直 在 队 首 )。 
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口 size() 返 回 堆 





口 finqMin() 返 回 最 小 的 元 素 ， 元 素 留 在 堆 中 。 
DaelMin() 返 回 最 小 的 元 素 ， 并 将 该 元 素 从 堆 中 移 除 。 
口 isEmpty () 在 堆 为 空 时 返回 True， 和 否则 返回 False。 


中 元 素 的 个 数 。 


口 puildHeap (1ist) 根 据 一 个 列表 创建 堆 。 
以 下 Python 会 话 展示 了 一 些 二 又 堆 方 法 的 用 法 。 





>>> from pythonds.trees import BinaryHeap 
>>> bh = BinaryHeap () 


>>> bh.insert (5) 
>>> bh.insert (7) 
>>> bh.insert (3) 


>>> bh.insert (11 


) 


>>> print (bh.delMin()) 


>>> print (bh.delMin()) 


>>> print (bh.delMin()) 





>>> print (bh.delMin()) 


6.6.2 ”二 叉 堆 的 实现 


1. 结构 属性 


为 了 使 二 又 堆 能 高 效 地 工作 ， 我 们 利用 树 的 对 数 性 质 来 表示 它 。 你 会 在 6.7.3 节 学 到 ， 为 了 
保证 对 数 性 能 ,必须 维持 树 的 平衡 。 平 衡 的 二 又 树 是 指 ， 其 根 节 点 的 左右 子 树 含有 数量 大 致 相等 


的 节点 。 在 实现 二 又 地 








时 ,我 们 通过 创建 一 棵 完全 二 叉 树 来 维持 树 的 平衡 。 在 完全 二 又 树 中 ， 除 


了 最 底层 ， 其 他 每 一 层 的 节点 都 是 满 的 。 在 最 底层 ， 我 们 从 左 往 右 填 充 节 点 。 图 6-14 展示 了 完 


全 二 又 树 的 一 个 例子 。 











图 6-14 完全 二 叉 树 
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完全 二 又 树 的 男 一 个 有 趣 之 处 在 于 ， 可 以 用 一 个 列表 来 表示 它 ， 而 不 需要 采用 “列表 之 列表 ” 
或 “节点 与 引用 ”表示 法 。 由 于 树 是 完全 的 ， 因 此 对 于 在 列表 中 处 于 位 置 己 的 节点 来 说 ， 它 的 左 子 
节点 正好 处 于 位 置 2p; 同 理 ， 右 子 节点 处 于 位 置 2p+1。 阁 要 找到 树 中 任意 节点 的 父 节 点 ， 只 需 使 
ee 下 人 和 多 节 上 他 上 的 人 种 92。 图 615 必 天 
一 棵 完全 二 义 树 ,并 给 出 了 列表 表示 。 树 的 列表 表示 一 一 加 上 这 个 “完全 ”的 结构 性 质 一 一 让 我 们 
人 



























































图 6-15 ”一 棵 完全 二 叉 树 及 其 列表 表示 





2. 堆 的 有 序 性 


我 们 用 来 存储 堆 元 素 的 方法 依赖 于 堆 的 有 序 性 。 堆 的 有 序 性 是 指 : 对 于 堆 中 任意 元 素 x 及 其 
父 元 素 p, p 都 不 大 于 x。 图 6-15 也 展示 出 完全 二 又 树 具备 堆 的 有 序 性 。 

3. 堆 操作 

首先 实现 二 又 堆 的 构造 方法 。 既然 用 一 个 列表 就 可 以 表示 整个 二 又 堆 , 那么 构造 方法 要 做 的 
就 是 初始 化 这 个 列表 与 属性 currentsize， 用 于 记录 堆 的 当前 大 小 。 代 码 清单 6-17 给 出 了 构造 
方法 的 Python 代码 。 列 表 heapList 的 第 一 个 元 素 是 0， 它 的 唯一 用 途 是 为 了 使 后 续 的 方法 可 
以 使 用 整数 除法 。 


代码 清单 6-17 新 建 二 又 堆 


lt def __ init _(self): 
2 self.heapList = [0] 
3 self.currentSize = 0 
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接 下 来 实现 insert 方法 。 将 元 素 加 入 列表 的 最 简单 、 最 高 效 的 方法 就 是 将 元 素 追 加 到 列表 
的 末尾。 追加 操作 的 优点 在 于 ， 它 能 保证 完全 树 的 性 质 ， 但 缺点 是 很 可 能 会 破坏 堆 的 结构 性 质 。 
不 过 可 以 写 一 个 方法 , 通过 比较 新 元 素 与 其 父 元 素来 重新 获得 堆 的 结构 性 质 。 如 果 新 元 素 小 于 其 
父 元 素 ， 就 将 二 者 交换 。 图 6-16 展示 了 将 新 元 素 放 到 正确 位 置 上 所 需 的 一 系列 交换 操作 。 



































图 6-16 “将 新 元 素 往 上 移 到 正确 位 置 














186 第 6 章 树 








注意 , 将 元 素 往 上 移 时 ,其 实 是 在 新 元 素 及 其 父 元 素 之 间 重 建 堆 的 结构 性 质 。 此 外 ,也 保留 
了 兄弟 元 素 之 间 的 堆 性 质 。 当 然 ， 如 果 新 元 素 很 小 ， 需 要 继续 往 上 一 层 交 换 。 代 码 清单 6-18 给 
出 了 percUp 方法 的 代码 ， 该 方法 将 元 素 一 直 沿 着 树 向 上 移动 ， 直 到 重 获 堆 的 结构 性 质 。 此 时 ， 
heapList 中 的 元 素 0 正好 能 发 挥 重 要 作用 。 我 们 使 用 整数 除法 计算 任意 节点 的 父 节 点 。 就 当前 
节点 而 言 ， 父 节点 的 下 标 就 是 当前 节点 的 下 标 除 以 2。 


代码 清单 6-18 percUnp 方法 






































中 def percUp(self, i): 

吕 while i // 2 > 0: 

3 if self.heapList[i] < self.heapListl[i // 2]: 
4 tmp = self.heapList[i // 2] 

5 self.heapList[i // 2] = self.heapList([i] 
6 self.heapList[i] = tmp 

7 A 





现在 准备 好 编写 insert 方法 了 。 代 码 清单 6-19 给 出 了 该 方法 的 Python 代码。 其实, insert 
方法 的 大 部 分 工作 是 由 percUp 方法 完成 的 。 当 元 素 被 追加 到 树 中 之 后 ，percUp 方法 将 其 移 到 
正确 的 位 置 。 


代码 清单 6-19 ”向 二 又 堆 中 新 加 元 素 


J def insert (self, k): 

多 self.heapList.append(k) 

3 self.currentSize = self.currentSize + 1 
4 self.percUp(self.currentSize) 









































正确 定义 insert 方法 后 ,就 可 以 编写 delMin 方法 。 既然 堆 的 结构 性 质 要 求 根 节点 是 树 的 
最 小 元 素 ， 那 么 查找 最 小 值 就 很 简单 。delMin 方法 的 难点 在 于 ， 如 何在 移 除根 节点 之 后 重 获 堆 
的 结构 性 质 和 有 序 性 。 可 以 分 两 步 重 建 堆 。 第 一 步 ， 取出 列表 中 的 最 后 一 个 元 素 ， 将 其 移 到 根 节 
点 的 位 置 。 移 动 最 后 一 个 元 素 保证 了 堆 的 结构 性 质 , 但 可 能 会 破坏 二 义 堆 的 有 序 性 。 第 二 步 , 将 
新 的 根 节 点 沿 着 树 推 到 正确 的 位 置 ， 以 重 获 堆 的 有 序 性 。 图 6-17 展示 了 将 新 的 根 节 点 移动 到 正 
确 位 置 所 需 的 一 系列 交换 操作 。 
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移 除 最 小 元 素 6》 








图 6-17 将 根 节 点 往 下 移 到 正确 位 置 
为 了 维持 堆 的 有 序 性 ,只 需 交 换 根 节点 与 它 的 最 小 子 节 点 即 可 。 重复 节点 与 子 节点 的 交换 过 
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程 ， 直 到 节点 比 其 两 个 子 节点 都 小 。 代 码 清单 6-20 给 出 了 percDown 方法 和 minchila 方法 的 
Python 代码 。 





代码 清单 6-20 percDown 方法 和 minchila 方法 





下 def percDown(self, i): 

分 while (i * 2) <= self.currentSize: 

3 mc = self.minChild(i) 

4 if self.heapList[i] > self.heapList [mc]: 
2 tmp = self.heapList([i] 

6 self.heapList[i] = self.heapList [mc] 
7 self.heapList[mc] = tmp 

8 i ee 

9 


def minChildl(self, i): 
if dw 2 LS SELf,. Currentsize: 
return i * 2 
else: 
if self.heapList[i*2] < self.heapList([i*2+1]: 
return i * 2 
else: 
return i * 2 +1 


J IIOPO 








delMin 方法 如 代码 清单 6-21 所 示 。 同 样 ， 主 要 工作 也 由 辅助 函数 完成 。 本 例 中 的 辅助 函数 


是 bercDown。 


代码 清单 6-21 从 二 又 堆 中 删除 最 小 的 元 素 











1 def delMin(self): 

此 retval = self.heapList[1] 

3 self.heapList[1] = self.heapList[self.currentSize] 
4 self.currentSize = self.currentSize - 1 

5 self.heapList.pop() 

6 self.percDown(1) 

return retval 





关于 二 又 堆 ， Re 点 需要 讨论 。 我 们 来 看 看 根据 元 素 列表 构建 整个 堆 的 方法 。 你 首先 
想到 的 方法 或 许 是 这 样 的 : 给 定 元 素 列表 ,每 次 搬入 一 个 元 素 , 构建 一 个 堆 。 由 于 是 从 列表 只 有 
一 个 元 素 的 情况 开始 , 并 且 ts 字 的 ,因此 可 以 采用 二 分 搜索 算法 找到 下 一 个 元 素 的 正确 搬 
入 位 置 , 时 间 复 杂 度 约 为 O(logn) 。 但是, 为 了 在 列表 的 中 部 插入 元 素 ， 可 能 需要 移动 其 他 元 素 ， 
以 为 新 元 素 腾 出 空间 ， 这 种 操作 的 时 间 复 杂 度 为 O0D) 。 因 此 ， 将 n 个 元 素 插入 堆 中 的 操作 为 
O(nlogn) 。 然 而 ,如 果 从 完整 的 列表 开始 ,构建 整个 堆 只 需 O(n) 。 代 码 清单 6-22 给 出 了 构建 整 
个 堆 的 代码 。 


代码 清单 6-22 ”根据 元 素 列表 构建 堆 


下 def buildHeap (self, alist): 
2 i = len(alist) // 2 
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3 self.currentSize = len(alist) 
4 self.heapList = [0] + alist[:] 
3 while (i > 0): 
6 self.percDown (i) 
7 二 -二 位: 一 :再 
最 初 状态 人 二 


图 6-18 根据 列表 [9，6，5，2，3] 构 建 堆 


图 6-18 展示 了 builaHeap 方法 进行 的 交换 过 程 , 它 将 各 节点 从 最 初 状 态 移 到 各 自 的 正确 位 
置 上 。 尽 管 从 树 的 中 间 开 始 , 向 根 的 方向 操作 , 但 是 percDown 方法 保证 了 最 大 的 节点 总 是 沿 着 
树 向 下 移动 。 在 这 棵 完全 二 叉 树 中 ， 超 过 中 点 的 节点 都 是 叶子 节点 ,没有 任何 子 节点 。 当 i = 1 
时 ,从 树 的 根 节点 往 下 移 , 可 能 需要 经 过 多 次 交换 。 如 你 所 见 , 9 先 被 移出 根 节 点 ,然后 percDown 
会 沿 着 树 检查 子 节点 ， 以 确保 尽量 将 它 往 下 移 。 在 本 例 中 ,9 的 第 2 次 交换 对 象 是 3。 这 样 一 来 ， 
9 就 移 到 了 树 的 底层 ,不 需要 再 做 交换 了 。 比 较 一 系列 交换 操作 后 的 列表 表示 将 有 助 于 理解 ， 如 
图 6-19 所 示 。 

































































二 7 
i 
0 








前 面 说 过 ,构建 堆 的 时 间 复 杂 度 是 O(n) ， 这 乍 一 听 可 能 很 难 理解 ， 证 明 过 程 超出 了 本 书 范 
上 畴 。 不 过 ,要 点 在 于 ， 因 子 logz 是 由 树 的 高 度 决定 的 。 在 builgHeap 的 大 部 分 工作 中 , 树 的 高 
度 不 足 logn 。 

利用 建 堆 的 时 间 复 杂 度 为 O(n) 这 一 点 ， 可 以 构造 一 个 使 用 堆 为 列表 排序 的 算法 ， 使 它 的 时 
间 复 杂 度 为 O(nlogn) 。 这 个 算法 留 作 练习 。 


6.7 二 叉 搜 索 树 


我 们 已 经 学 习 了 两 种 从 集合 中 获取 键 - 值 对 的 方法 。 回 想 一 下 ， 我 们 讨论 过 映射 抽象 数据 类 
型 的 两 种 实现 ,它们 分 别 是 列表 二 分 搜索 和 散 列 表 。 本 闻 将 探讨 二 叉 搜索 树 ， 它 是 映射 的 另 一 种 
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实现 。 我 们 感 兴趣 的 不 是 元 素 在 树 中 的 确切 位 置 ， 而 是 如 何 利 用 二 又 树 结构 提供 高 效 的 搜索 。 


6.7.1 搜索 树 的 操作 


在 实现 搜索 树 之 前 , 我 们 来 复习 一 下 映射 抽象 数据 类 型 提供 的 接口 。 你 会 发 现 ,这 个 接口 类 
似 于 Python 字典 。 


新 建 一 个 空 的 映射 。 

口 put (key，val) 往 映射 中 加 入 一 个 新 的 键 - 值 对 。 如 果 键 已 经 存在 ， 就 用 新 值 替 换 旧 值 。 
D get (key) 返 回 key 对 应 的 值 。 如 果 key 不 存在 ， 则 返回 None。 

D del 通过 del map [key] 这 样 的 语句 从 映射 中 删除 键 - 值 对 。 

D len() 返 回 映射 中 存储 的 键 - 值 对 的 数目 。 

D in 通过 key in map 这 样 的 语句 ， 在 键 存 在 时 返回 True， 否 则 返回 False。 








口 Map 





















































6.7.2 ”搜索 树 的 实现 


二 又 搜索 树 依赖 于 这 样 一 个 性 质 : 小 于 父 节 点 的 键 都 在 左 子 树 中 , 大 于 父 节点 的 键 则 都 在 右 
子 树 中 。 我 们 称 这 个 性 质 为 二 叉 搜 索性 ， 它 会 引导 我 们 实现 上 述 映射 接口 。 图 6-20 描绘 了 二 又 
搜索 树 的 这 个 性 质 ， 图 中 只 展示 了 键 , 没有 展示 对 应 的 值 。 注 意 , 每 一 对 父 节 点 和 子 节 点 都 具有 
这 个 性 质 。 左 子 树 的 所 有 键 都 小 于 根 节 点 的 键 ， 右 子 树 的 所 有 键 则 都 大 于 根 节点 的 键 。 
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图 6-20 ”简单 的 二 又 搜索 树 
接 下 来 看 看 如 何 构造 二 又 搜索 树 。 6-20 中 的 节点 是 按 如 下 顺序 插入 键 之 后 形成 的 : 70 
































31、93、94、14、23、73。 因 为 70 是 第 一 个 插入 的 键 ， 所 以 是 根 节点 。31 小 于 70， 所 以 成 
为 70 的 左 子 节 点 。93 大 于 70, 所 以 成 为 70 的 右 子 节点 。 现 在 树 的 两 层 已 经 满 了 ,所 以 下 一 个 
键 会 成 为 31 或 93 的 子 节点 。94 比 70 和 93 都 要 大 ， 所 以 它 成 了 93 的 右 子 节点 。 同 理 ，14 
比 70 和 31 都 要 小 , 所 以 它 成 了 31 的 左 子 节 点 。23 也 小 于 31, 所 以 它 必定 在 31 的 左 子 树 中 。 
而 它 又 大 于 14， 所 以 成 了 14 的 右 子 节点 。 
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我 们 将 采用 “节点 与 引用 ”表示 法 实现 二 又 搜索 树 ， 它 类 似 于 我 们 在 实现 链表 和 表达 式 树 时 
采用 的 方法 。 不 过 ,由 于 必须 创建 并 处 理 一 棵 空 的 二 又 搜索 树 ， 因 此 我 们 将 使 用 两 个 类 。 一 个 称 
作 BinarySearchTree, 另 一 个 称 作 TreeNode。 BinarySearchTree 类 有 一 个 引用 ， 指向 作 
为 二 又 搜索 树 根 节点 的 TreeNode 类 。 大 多 数 情况 下 ， 外 面 这 个 类 的 方法 只 是 检查 树 是 否 为 空 。 
如 果树 中 有 节点 ， 请 求 就 被 发 往 BinarySearchTree 类 的 私有 方法 ， 这 个 方法 以 根 节点 作为 参 
数 。 当 树 为 空 ， 或 者 想 删 除根 节点 的 键 时 ， 需 要 采取 特殊 措施 。 代 码 清单 6-23 是 
BinarySearchTree 类 的 构造 方法 及 一 些 其 他 的 方法 。 


代码 清单 6-23 BinarySearchTree 类 


























class BinarySearchTree: 


1 

2 

3 def _ init_ _ (self) : 
4 self.root = None 
5, self.size = 0 

6 
2 
8 


def length(self): 
return self.size 


9 

10 def __len (self): 

11 return self.size 

1 有 2 

Lie: def __ iter (self): 

14 return self.root. iter _() 





TreeNode 类 提供 了 很 多 辅助 函数 ， 这 大 大 地 简化 了 BinarySearchTree 类 的 工作 。 代 码 
清单 6-24 是 TreeNode 类 的 构造 方法 以 及 辅助 函数 。 可 以 看 到 ， 很 多 辅助 函数 有 助 于 根据 子 节 
点 的 位 置 (是 左 还 是 右 ) 以 及 自己 的 子 节点 类 型 来 给 节点 归 类 。 


代码 清单 6-24 TreeNode 类 





















































class TreeNode : 
def _ init (self， 


key, val, left=None, right=None, 
parent=None): CE 
self.key = key 


1 
2 
3 
4 
5 self.payload = val 
6 
7 
8 
9 





Self.. leftChiLd’s. Left 
self.rightChild = right 
self.parent = parent 


def hasLeftChild(self): 
return self.leftChild 


def hasRightChild(self): 
return self.rightChild 


def isLeftChilgd(self): 
return self.parent and \ 
self.parent.leftChild == self 


OAOUUPRWVDOD PO 
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19 

20 def isRightChild(self): 

21 return self.parent and \ 

22 self.parent .rightChild == self 

23 

24 def isRoot (self): 

A return not self.parent 

26 

27 def isLeaf (self): 

28 return not (self.rightChild or self.leftChild) 
29 

30 def hasAnyChildren(self): 

a return self.rightChild or self.leftChild 
32 

号 def hasBothChildren (self): 

34 return self.rightChild and self.leftChild 
35 

36 def replaceNodeData(self, key, value, lc, rc): 
37 self.key = key 

38 self.payload = value 

39 self .LeftChild se .Le 

40 self.rightChild = rc 

41 if self.hasLeftChild(): 

42 self.leftChild.parent = self 

43 if self.hasRightChild(): 

44 self.rightChild.parent = self 








TreeNode 类 与 6.4.2 节 中 的 BinaryTree 类 有 一 个 很 大 的 区 别 ， 那 就 是 显 式 地 将 每 个 节点 
的 父 节 点 记录 为 它 的 一 个 属性 。 在 讨论 ael 操作 的 实现 时 ， 你 会 看 到 这 一 点 为 何 重要 。 

在 TreeNogde 类 的 实现 中 ， 另 一 个 有 趣 之 处 是 使 用 Python 的 可 选 参数 。 可 选 参数 使 得 在 多 
种 环境 下 创建 TreeNode 更 方便 。 有 时 ， 我 们 想 构 造 一 个 已 有 parent 和 chila 的 TreeNode。 
可 以 将 父 节 点 和 子 节 点 作为 参数 传人 。 其 他 时 候 ， 只 通过 键 - 值 对 创建 TreeNode ， 而 不 传人 
parent 和 childa。 在 这 种 情况 下 ， 可 选 参数 使 用 默认 值 。 


现在 有 了 BinarySearchTree 和 TreeNodqe， 是 时 候 写 一 个 帮 有 我们 构建 二 又 搜 索 树 的 put 
方法 了 。put 是 BinarySearchTree 类 的 一 个 方法 。 它 检查 树 是 和 否 已 经 有 根 节 点 ， 若 没有 ， 就 
创建 一 个 TreeNode， 并 将 其 作为 树 的 根 节点 ; 若 有 ,就 调用 私有 的 递归 辅助 函数 _put ， 并 根据 
以 下 算法 在 树 中 搜索 。 


口 从 根 节 点 开始 搜索 二 又 树 ， 比 较 新 键 与 当前 节点 的 键 。 如 果 新 键 更 小 ， 搜 索 左 子 树 。 如 
果 新 键 更 大 ， 搜 索 右 子 树 。 

口 当 没 有 可 供 搜索 的 左 〈 右 ) 子 节点 时 ， 就 说 明 找到 了 新 键 的 插入 位 置 。 

口 向 树 中 插入 一 个 节点 ， 做 法 是 创建 一 个 TreeNode 对 象 ， 并 将 其 插入 到 前 一 步 发 现 的 位 
置 上 。 
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向 树 中 插入 新 节点 的 方法 如 代码 清单 6-25 所 示 。 按 照 上 述 步 又, 我 们 将 _put 写成 递归 函数 。 
注意 ， 在 向 树 中 插入 新 的 子 节点 时 ， currentNode 被 作为 父 节 点 传人 新 树 。 


代码 清单 6-25 ”为 二 又 搜索 树 插入 新 节点 























4 def put (self, key, val): 

2 if self.root: 

3 self. _ put (key, val, self.root) 

4 else: 

5 self.root = TreeNode (key, val) 

6 self.size = self.size + 1 

7 

8 def _put(self, key, val, currentNode): 

9 if key < currentNode.key: 

10 if currentNode.hasLeftChild(): 

11 self. _ put (key, val, currentNode.leftChild) 

12 else: 

13 currentNode.leftChild = TreeNode(key, val, 

14 parent=currentNode) 

WS else: 

16 if currentNode.hasRightChild(): 

下 self. put (key, val, currentNode.rightChild) 
18 else: 

19 currentNode.rightChild = TreeNode (key, val, 
20 parent=currentNode) 








插入 方法 有 个 重要 的 问题 ; 不 能 正确 地 处 理 重 复 的 键 。 遇 到 重复 的 键 时 ， 它 会 在 已 有 节点 的 
右 子 树 中 创建 一 个 具有 同样 键 的 节点 。 这 样 做 的 结果 就 是 搜索 时 永远 发 现 不 了 较 新 的 键 。 要 处 理 
重复 键 插入 ， 更 好 的 做 法 是 用 关联 的 新 值 奉 换 旧 值 。 这 个 修复 工作 留 作 练习 。 

定义 put 方法 后 ， 就 可 以 方便 地 通过 让 __setitem 方法 调用 put 方法 来 重 载 [] 运算 符 。 
如 此 一 来 ， 就 可 以 写 出 像 myzipTree['Plymouth'] = 55446 这 样 的 Python 语句 ， 就 如 同 访 
问 Python 字典 一 样 。 setitem_ 方法 如 代码 清单 6-26 所 示 。 


代码 清单 6-26 __setitem 方法 


1 def _ setitem (self, k, v): 
2 self.put (k, v) 









































图 6-21 展示 了 向 二 叉 搜索 树 中 插入 新 节点 的 过 程 。 浅 灰色 节点 表示 在 插入 过 程 中 被 访问 过 
的 节点 。 

构造 出 树 后 ， 下 一 个 任务 就 是 实现 为 给 定 的 键 取 值 。get 方法 比 put 方法 还 要 简单 ， 因 为 
它 只 是 递归 地 搜索 二 又 树 ， 直 到 访问 到 叶子 节点 或 者 找到 匹配 的 键 。 在 后 一 种 情况 下 ， 它 会 返回 
节点 中 存储 的 值 。 





194 第 6 章 树 








图 6-21 


/ 
/ 
© 


插入 键 为 19 的 新 节点 





get、_get 和 ”getitem 的 实现 如 代码 清单 6-27 所 示 。_get 方法 中 的 搜索 代码 和 _put 
方法 中 选择 左右 子 节点 的 逻辑 相同 。 注 意 ，_get 方法 返回 一 个 TreeNode 给 get。 这 样 一 来 ， 
对 于 其 他 BinarySearchTree 方法 来 说 , 如果 需 要 使 用 TreeNode 有 效 载荷 之 外 的 数据 ，_get 





可 以 作为 灵活 的 辅助 函数 使 用 。 


通过 实现 getitem 方法 ， 可 以 写 出 类 似 于 访问 字典 的 Python 语句 
是 二 叉 搜索 树 一 一 比如 z = myzZipTree['Fargo']。 从 代码 清单 6-27 可 以 看 出 ， 








方法 要 做 的 就 是 调用 get 方法 。 
代码 清单 6-27 ”查找 键 对 应 的 值 


























而 实际 上 使 用 的 








getitem _ 





1 def get (self, key): 

2 if self.root: 

3 res = self. get (key, self.root) 
4 if res: 

5 return res.payload 

6 else: 

3 return None 

8 else: 

9 return None 


if not currentNode: 
return None 

elif currentNode.key == key: 
return currentNode 

elif key < currentNode.key: 


J OUR PO 





def _get (self, key, currentNode): 


return self. get (key, currentNode.leftChild) 
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18 else: 

19 return self._ get (key, currentNode.rightChild) 
20 

21 def _ getitem (self, key): 

必 训 return self.get (key) 





利用 get 方法 , 可 以 通过 为 BinarySearchTree 编写 contains 方法 来 实现 in 操作 。 
__contains_ 方法 只 需 调 用 get 方法 , 并 在 get 方法 返回 一 个 值 时 返回 True, 或 在 get 方法 
返回 None 时 返回 False。 代 码 清单 6-28 实现 了 contains_ ”方法 。 


代码 清单 6-28 ”检查 树 中 是 否 有 某 个 键 


def _ contains_ _(self, key): 
if self. get (key, self.root): 
return True 
else: 
return False 





























ORODP 








你 应 该 记得 ， contains 方法 重 载 7 in 运算 符 ， 因 此 我 们 可 以 写 出 这 样 的 语句 : 


if 'Northfield' in myZipTree: 
print ("oom ya ya") 


最 后 ， 我 们 将 注意 力 转向 二 叉 搜索 树 中 最 有 挑战 性 的 方法 一 一 删除 一 个 键 。 第 一 个 任务 是 
在 树 中 搜索 并 找到 要 删除 的 节点 。 如 果树 中 不 止 一 个 节点 ， 使 用 _get 方法 搜索 ， 
TreeNode。 如 果树 中 只 有 一 个 节点 ， 则 意味 着 要 移 除 的 是 根 节点 ， 不 过 仍 要 确保 根 节点 的 键 就 
是 要 删除 的 键 。 无 论 哪 种 情况 ， 如 果 找 不 到 要 删除 的 键 ，aelete 方法 都 会 抛 出 一 个 异常 ， 如 代 
码 清单 6-29 所 示 。 


代码 清单 6-29 aelete 方法 









































1 def deletel(self, key): 

2 if self.size > 1: 

3 nodeToRemove = self._get (key, self.root) 
4 if nodeToRemove: 

5 self.remove (nodeToRemove) 

6 self.size = self.size -1 

J else: 

8 raise KeyError('Error, key not in tree') 
9 elif self.size == 1 and self.root.key == key: 
10 self.root = None 

11 self.size = self.size -1 

12 else: 

13 raise KeyError('Error, key not in tree') 
14 


15 def _ delitem (self, key): 
下 在 self.delete (key) 
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一 旦 找到 待 删除 键 对 应 的 节点 ， 就 必须 考虑 3 种 情况 。 
(1) 待 删 除 节 点 没有 子 节 点 ( 如 图 6-22 所 示 )。 





图 6-22 ” 待 删 除 节点 16 没有 子 节点 
(2) 待 删除 节点 只 有 一 个 子 节点 ( 如 图 6-23 所 示 )。 








图 6-23” 待 删除 节点 25 有 一 个 子 节点 


(3) 待 删除 节点 有 两 个 子 节 点 ( 如 图 6-24 所 示 )。 
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图 6-24 待 删除 节点 5 有 两 个 子 节点 
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情况 1 很 简单 。 如 果 当 前 节点 没有 子 节点 ， 要 做 的 就 是 删除 这 个 
节点 的 引用 ， 如 代码 清单 6-30 所 示 。 


代码 清单 6-30 ”情况 1: 待 删除 节点 没有 子 节 点 





电 if _ currentNodqe.isLeaf () : 

2 if currentNode == currentNode.parent.leftChild: 
3 currentNode.parent.leftChild = None 

4 else: 

5 currentNode.parent .rightChild = None 





情况 2 稍微 复杂 些 。 如 果 待 删除 节点 只 有 一 个 子 节点 ， 那 么 可 以 用 子 节点 取代 待 删除 节点 ， 
如 代码 清单 6-31 所 示 。 查 看 这 上 段 代 码 后 会 发 现 ， 它 考虑 了 6 种 情况 。 由 于 左右 子 节点 的 情况 是 
对 称 的 ， 因 此 只 需要 讨论 当前 节点 有 左 子 节 点 的 情况 。 

(1) 如 果 当 前 节点 是 一 个 左 子 节点 ， 只 需 将 当前 节点 的 左 子 节点 对 父 节点 的 引用 改 为 指向 当 
前 节点 的 父 节 点 ， 然 后 将 父 节 点 对 当前 节点 的 引用 改 为 指向 当前 节点 的 左 子 节点 。 

(2) 如 果 当 前 节点 是 一 个 右 子 节点 ， 只 需 将 当前 节点 的 右 子 节点 对 父 节点 的 引用 改 为 指向 当 
前 节点 的 父 节 点 ， 然 后 将 父 节 点 对 当前 节点 的 引用 改 为 指向 当前 节点 的 右 子 节点 。 

(3) 如 果 当 前 节点 没有 父 节 点 ， 那 它 肯 定 是 根 节 点 。 调 用 replaceNodeData 方法 ， 替 换 根 
节点 的 key、payload、leftchilg 和 rightchild 数据 。 























198 第 6 章 树 





代码 清单 6-31 情况 2: 竺 删除 节点 只 有 一 个 子 节 ， 


点 





else: # 只 有 一 个 子 节点 
if _ currentNodqe .hasLeftCchild() : 

if currentNode.isLeftChild(): 
currentNode.leftChild.parent 
currentNode.parent.leftChild 

elif currentNode.isRightChild(): 
currentNode.leftChild.parent 
currentNode.parent .rightChild 

else: 


下 
2 
3 
4 
5 
6 
也 
8 
9 





else: 

if currentNode.isLeftChild(): 
currentNode.rightChild.parent 
currentNode.parent.leftChild 

elif currentNode.isRightChild(): 
currentNode.rightChild.parent 
currentNode.parent .rightChild 

else: 


oo ~ 必用 口 





‘Oo 


Sn 
be 


DD 
ho 二 


CO N 
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currentNode.paren 
currentNode.rightC 


currentNode.paren 
currentNode.rightChild 


currentNode.parent 
currentNode.leftChild 


currentNode.parent 
currentNode.leftChild 


currentNode.replaceNodeData (currentNode.leftChild.key, 
currentNode.leftChild.payload, 
currentNode.leftChild.1lef 
currentNode.leftChild.rig 


EChiLas 
htchild) 


hild 





currentNode.replaceNodeData (currentNode.rightChild.key, 
currentNode.rightChild.payloadgd, 
currentNode.rightChild.1leftChilgd, 
currentNode.rightChild.rightChild) 





情况 3 最 难处 理 。 如 果 
来 解决 问题 











。 不 过 ， 可 以 搜索 整 棵 树 ， 找 到 可 以 鞭 换 生 


一 个 节点 有 两 个 子 节点 , 那 就 不 太 可 能 仅 靠 用 其 中 一 个 子 节点 取代 它 
等 删除 节点 的 节点 。 候 选 节 点 要 外 0 
树 都 保持 二 又 搜索 树 的 关系 ,也 就 是 树 中 具有 次 大 键 的 节点 。 我 们 将 这 个 


节点 称 为 后 继 节点 ， 有 


一 种 方法 能 快速 找到 它 。 后 继 节 点 的 子 节点 必定 不 会 多 于 一 个 ， 和 


两 种 删除 方法 来 移 除 它 。 移 除 后 继 节 点 后 ， 上 





只 需 直 接 将 它 放 到 树 中 待 删除 











处 理 情况 3 的 代码 如 代码 清单 6-32 所 示 。 注 意 ,我 们 用 畏 











来 寻找 后 继 节点 ， 并 用 spliceOut 方法 移 除 它 























贡 点 的 位 置 上 即 可 。 


助 函 数 findqsuccessor 和 findMin 


(如 代码 清单 6-34 所 示 )。 之 所 以 用 spliceout 


方法 , 是 因为 它 可 以 直接 访问 竺 拼接 的 节点 , 并 进行 正确 的 修改 。 虽 然 也 可 以 递归 调用 aelete， 








但 那样 做 会 浪费 时 间 重 复 搜索 键 的 节点 。 
代码 清单 6-32 ”情况 3: 待 删除 节点 有 两 个 子 节点 





elif currentNode.hasBothChildren(): # 内 部 
SUCC currentNode.findSuccessor () 
succ.spliceOut() 
currentNode.key succ.key 
currentNode.payload succ.payload 


1 
2 
3 
4 
5 





寻找 后 继 节点 的 代码 如 代码 清单 6-33 所 示 。 可 以 看 出 ， 这 
利用 的 二 又 搜索 树 属 














性 ， 也 是 从 小 到 大 打印 出 树 节点 的 中 序 遍 历 所 利用 的 。 在 查找 后 

















类 的 一 个 方法 。 
继 节 点 人 


这 是 TreeNode 
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要 考虑 以 下 3 种 情况 。 
(1) 如 果 节 点 有 右 子 节点 ， 那 么 后 继 节 点 就 是 右 子 树 中 最 小 的 节点 。 
(2) 如 果 节 点 没有 右 子 节点 ， 并 且 其 本 和 刁 是 父 季 点 的 左 子 节 点 ， 那么 后 继 节点 就 是 父 节 点 。 
节 


(3) 如 果 节 点 是 父 节点 的 右 子 节点 , 并 且 其 本 身 没有 右 子 节点 , 那么 后 继 节点 就 是 除 其 本 身 外 
父 节 点 的 后 继 节点 。 


在 试图 从 一 棵 二 又 搜索 树 中 删除 节点 时 , 上 述 第 一 个 条 件 是 唯一 重要 的 ,但 是 , findsuccessor 
方法 还 有 其 他 用 途 ， 本 章 末 会 进行 探索 。 

findqMin 方法 用 来 查找 子 树 中 最 小 的 键 。 可 以 确定 ,在 任意 二 又 搜索 树 中 ， 最 小 的 键 就 是 最 
左边 的 子 节 点 。 鉴 于 此 ，findMin 方法 只 需 沿 着 子 树 中 每 个 节点 的 leftchild 引 用 走 ， 直 到 遇 
到 一 个 没有 左 子 节点 的 节点 。 代 码 清单 6-35 给 出 了 完整 的 remove 方法 。 


代码 清单 6-33 ”寻找 后 继 节 点 



































IT 







































































1 def findSuccessor (self): 

史 succ = None 

3 if self.hasRightChild(): 

4 succ = self.rightChild.findMin() 

5 else: 

6 if self.parent: 

7 if self.isLeftChild(): 

8 succ = self.parent 

9 else: 
self.parent.rightChild = None 
succ = self.parent.findSuccessor() 
self.parent.rightChild = self 

return succ 


def findMin(self): 
current = self 
while current.hasLeftChild(): 
current = current.leftChild 
return current 


Le BE Be eo Ek 21 3 9 0 











代码 清单 6-34 ”spliceout 方法 





1 def spliceOut (self): 

2 if self.isLeaf(): 

3 if self.isLeftChild(): 

4 self.parent.leftChild = None 
5 else: 

6 self.parent .rightChild = None 
学 elif self.hasAnyChildren(): 

8 if self.hasLeftChild(): 

9 if self.isLeftChild(): 

下 self.parent.leftChild = self.leftChild 
由 else: 


3 
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12 self.parent .rightChild = self.leftChild 
13 self.leftChild.parent = self.parent 
14 else: 
Me if self.isLeftChild(): 
16 self.parent.leftChild = self.rightChild 
17 else: 
18 self.parent .rightChild = self.rightChild 
19 self.rightChild.parent = self.parent 








代码 清单 6-35 ”remove 方法 
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def remove(self, currentNode): 


if currentNode.isLeaf(): 上 # 叶子 节点 
if currentNodqe == currentNode.parent.leftChild: 
currentNode.parent.leftChild = None 
else: 
currentNode.parent .rightChild = None 
elif currentNode.hasBothChildren(): # 内 部 
succ = currentNode.findSuccessor() 


succ.spliceOut() 
currentNode.key = succ.key 
currentNode.payload = succ.payload 


else: # 只 有 一 个 子 节点 
if currentNode.hasLeftChild(): 
if currentNode.isLeftChild(): 
currentNode.leftChild.parent = currentNode.parent 
currentNode.parent.leftChild = currentNode.leftChild 
elif currentNode.isRightChild(): 
currentNode.leftChild.parent = currentNode.parent 
currentNode.parent .rightChild = currentNode.leftChild 
else: 
currentNode.replaceNodeData (currentNode.leftChild.key, 
currentNode.leftChild.payload, 
currentNode.leftChild.1leftChilgd, 
currentNode.leftChild.rightChild) 


else: 
if currentNode.isLeftChild(): 
currentNode.rightChild.parent = currentNode.parent 
currentNode.parent.leftChild = currentNode.rightChild 
elif currentNode.isRightChild(): 
currentNode.rightChild.parent = currentNode.parent 
currentNode.parent .rightChild = currentNode.rightChild 
else: 
currentNode.replaceNodeData (currentNode.rightChild.key, 
currentNode.rightChild.payload, 
currentNode.rightChild.1leftChilgd, 
currentNode.rightChild.rightChild) 
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现在 来 看 看 最 后 一 个 二 叉 搜 索 树 接 口 方法 。 假设 我 们 想 按 顺 序 遍 历 树 中 的 键 。 我 们 在 字典 中 
就 是 这 么 做 的 , 为 什么 不 在 树 中 试 试 呢 ? 我 们 已 经 知道 如 何 按 顺序 遍历 二 叉 树 一 一 使 用 中 序 遍 历 
算法 。 不 过 ,为 了 创建 迭代 器 ， 还 需要 做 更 多 工作 ， 因 为 迭代 器 每 次 调用 只 返回 一 个 节点 。 

Python 为 创建 迭代 器 提供 了 一 个 很 强大 的 函数 ， 即 yielg。 与 return 类 似 ，yielg 每 次 
向 调用 方 返回 一 个 值 。 除 此 之 外 , yiela 还 会 冻结 函数 的 状态 ,因此 下 次 调用 函数 时 , 会 从 这 次 
离开 之 处 继续 。 创 建 可 迭代 对 象 的 函数 被 称 作 生成 器 。 


二 又 搜索 树 迭 代 需 的 代码 如 代码 清单 6-36 所 示 。 请 仔细 看 看 这 份 代码 。 乍 看 之 下 ， 你 可 能 
会 认为 它 不 是 递归 的 。 但 是 ， 因 为 ”iter_ 重 载 了 循环 的 for x in 操作 ， 所 以 它 真 的 是 递归 
的 ! 由 于 在 TreeNogde 实例 上 递归 ， 因 此 ”iter_ 方法 被 定义 在 TreeNogde 类 中 。 


代码 清单 6-36 ”二 又 搜索 树 迭 代 器 


def __iter__(self): 
Lf SELE: 
if self.hasLeftChild(): 
for elem in self.leftChild: 
yield elem 
yield self.key 
if self.hasRightChild(): 
for elem in self.rightChild: 
yield elem 






































\Do、~awmW 心 wmN 情 





6.7.3 ”搜索 树 的 分 析 


至 此 ， 我 们 已 经 完整 地 实现 了 二 又 搜索 树 ， 接 下 来 简单 地 分 析 它 的 各 个 方法 。 先 分 析 put 
方法 ， 限 制 其 性 能 的 因素 是 二 又 树 的 高 度 。6.3 节 曾 说 过 ， 树 的 高 度 是 其 中 节点 层 数 的 最 大 值 。 
高 度 之 所 以 是 限制 因素 ， 是 因为 在 搜索 合适 的 插入 位 置 时 ， 每 一 层 最 多 需要 做 一 次 比较 。 

那么 ,二叉树 的 高 度 是 多 少 呢 ? 答案 取决 于 键 的 搬入 方式 。 如 果 键 的 插 和 人 顺序 是 随机 的 , 那 
么 树 的 高 度 约 为 log,n ， 其 中 三 为 树 的 节点 数 。 这 是 因为 ， 若 键 是 随机 分 布 的 ， 那 么 小 于 和 大 于 
根 节 点 的 键 大 约 各 占 一 半 。 二 又 树 的 顶层 有 1 个 根 节点 , 第 1 层 有 2 个 节点 , 第 2 层 有 4 个 节点 ， 
依 此 类 推 。 在 完全 平衡 的 二 叉 树 中 ， 节 点 总 数 是 2 和 -1， 其 中 大 代 表 树 的 高 度 。 

在 完全 平衡 的 二 又 树 中 , 左右 子 树 的 节点 数 相同 , 最 坏 情 况 下 , put 的 时 间 复 杂 度 是 O(log, n) ， 
其 中 是 树 的 节点 数 。 注意, 这 是 上 一 段 所 述 运 算 的 道 运 算 。 所 以 ，log, nn 是 树 的 高 度 , 代表 put 
在 搜索 合适 的 插入 位 置 时 所 需 的 最 大 比较 次 数 。 

不 幸 的 是 ， 按 顺序 插入 键 可 以 构造 出 一 棵 高 度 为 n 的 搜索 树 ! 6-25 就 是 一 个 例子 ， 这 时 
put 方法 的 时 间 复 杂 度 为 O(n) 。 
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图 6-25 ” 偏 斜 的 二 又 搜索 树 


既然 理解 了 为 何 说 put 的 性 能 由 树 的 高 度 决定 ， 你 应 该 可 以 猜 到 ，get 、in 和 del 也 都 如 
此 。get 在 树 中 查找 键 , 最 坏 情况 就 是 沿 着 树 一 直 搜 到 底 也 没 找到 。 乍 看 之 下 ,ael 可 能 更 复杂 ， 
为 在 删除 节点 前 可 能 还 得 找到 后 继 节 点 。 但 是 查找 后 继 节 点 的 最 坏 情况 也 受 限 于 树 的 高 度 , 也 
就 是 把 工作 量 加 一 倍 。 所 以 ， 对 于 不 平衡 的 树 来 说 ， 最 坏 情况 下 的 时 间 复 杂 度 仍 是 O(n) 。 


6.8 平衡 二 叉 搜 索 树 


在 6.7 节 中 ,我 们 了 解 了 二 又 搜索 树 的 构建 过 程 。 我 们 已 经 知道 ， 当 二 又 搜索 树 不 平衡 时 ， 
get 和 put 等 操作 的 性 能 可 能 降 到 O(n) 。 本 节 将 介绍 一 种 特殊 的 二 又 搜索 树 ， 它 能 自动 维持 平 
衡 。 这 种 树 叫 作 AVL 树 ， 以 其 发 明 者 G. M. Adelson-Velskii 和 了. M. Landis 的 姓氏 命名 。 

AVL 树 实现 映射 抽象 数据 类 型 的 方式 与 普通 的 二 又 搜索 树 一 样 , 唯一 的 差别 就 是 性 能 。 实现 
AVL 树 时 ， 要 记录 每 个 节点 的 平衡 因子 。 我 们 通过 查看 每 个 节点 左右 子 树 的 高 度 来 实现 这 一 点 。 
更 正式 地 说 ， 我 们 将 平衡 因子 定义 为 左右 子 树 的 高 度 之 差 。 

balance Factor = height(left SubTree)— height(right SubTree) 


根据 上 述 定义 ， 如 果 平 衡 因 子 大 于 零 ， 我 们 称 之 为 左倾 ; 如果 平衡 因子 小 于 零 ， 就 是 右倾 ; 
如 果 平 衡 因子 等 于 零 ， 那 么 树 就 是 完全 平衡 的 。 为 了 实现 AVL 树 并 利用 平衡 树 的 优势 ， 我 们 将 
平衡 因子 为 -1、0 和 1 的 树 都 定义 为 平衡 树 。 一 旦 某 个 节点 的 平衡 因子 超出 这 个 范围 ， 我 们 就 需 
要 通过 一 个 过 程 让 树 恢复 平衡 。 图 6-26 展示 了 一 棵 右倾 树 及 其 中 每 个 节点 的 平衡 因子 。 
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图 6-26 ” 带 平衡 因子 的 右倾 树 


6.8.1 AVL 树 的 性 能 


我 们 先 看 看 限定 平衡 因子 带 来 的 结果 。 我 们 认为 ， 保 证 树 的 平衡 因子 为 -1、0 或 1， 可 以 使 
关键 操作 获得 更 好 的 大 O 2 。 首 先 考 虑 平衡 因子 如 何 改 善 最 坏 情况 。 有 左倾 与 右倾 这 两 种 可 
能 性 。 如 果 考 虑 高 度 为 0、 We 图 6-27 展示 了 应 用 新 规则 后 最 不 平衡 的 左倾 树 。 


- 


图 6-27 左倾 AVL 了 情况 
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查看 树 中 的 节点 数 之 后 可 知 ， 高 度 为 0 时 有 1 个 节点 ,高度 为 1 时 有 2 个 节点 (1+1=2)， 
度 为 2 时 有 4 个 节点 (1+ 1+2=4)， 高 度 为 3 时 有 7 个 节点 (1 +2+4=7)。 也 就 是 说 ， 当 
度 为 h 时 ， 厄 点 数 入, 是 : 























异型 


N, =1+N, ,+N,, 


你 或 许 觉得 这 个 公式 很 眼熟 ， 因 为 它 与 斐 波 那 契 数列 很 相似 。 可 以 根据 它 推导 出 由 AVL 树 
的 节点 数 计算 高 度 的 公式 。 在 斐 波 那 契 数列 中 ， 第 ;个 数 是 : 


=0 
Esl 


1 


P= +h,,i 之 2 
一 个 重要 的 事实 是 ， 随 着 斐 波 那 契 数列 的 增长 ， 妃 /逐渐 通 近 黄金 分 割 比例 @ ， 


关于 二 如 果 你 好 奇 这 个 等 式 的 推导 过 程 ， 可 以 找 一 本 数学 书 看 看 。 我 们 在 此 直接 使 用 这 个 


等 式 ， 将 已 近似 为 已 =@1V5 。 由 此 ， 可 以 将 的 等 式 重 写 为 : 



































Ni Fri —!1, Ph 三 1 
用 黄金 分 割 近似 鞭 换 ， 得 到 





DY 
N, = -1 


V5 
移 项 ， 两 边 以 2 为 底 取 对 数 ， 求 ,得 到 : 





1 
log N, +1 站 


log N， +1-2log D+ log5 
hi= 





log®D 
h=1.44logN, 
在 任何 时 间 ，AVL 树 的 高 度 都 等 于 节点 数 取 对 数 再 乘 以 一 个 常数 ( 1.44 )。 对 于 搜索 AVL 树 
来 说 ， 这 是 一 件 好 事 ， 因 为 时 间 复 杂 度 被 限制 为 Odlog V) 。 























6.8.2 AVL 树 的 实现 


我 们 已 经 证 明 ， 保 持 AVL 树 的 平衡 会 带 来 很 大 的 性 能 优势 ， 现 在 看 看 如 何 往 树 中 插入 一 个 
键 。 所 有 新 键 都 是 以 叶子 节点 搬入 的 ,因为 新 叶子 节点 的 平衡 因子 是 零 ， 所 以 新 捅 节点 没有 什么 
限制 条 件 。 但 插入 新 节点 后 , 必须 更 新 父 节点 的 平衡 因子 。 新 的 叶子 节点 对 其 父 节 点 平衡 因子 的 
影响 取决 于 它 是 左 子 节 点 还 是 右 子 方 点。 如 果 是 右 子 节点 , 父 广 点 的 平衡 因子 减 一 。 如 果 是 左 子 
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节点 ， 则 父 节点 的 平衡 因子 加 一 。 这 个 关系 可 以 递归 地 应 用 到 每 个 祖先 ， 直 到 根 节 点 。 既 然 更 新 
平衡 因子 是 递归 过 程 ， 就 来 检查 以 下 两 种 基本 情况 : 
口 递归 调用 抵达 根 节 点 ; 
口 父 节 点 的 平衡 因子 调整 为 零 ; 可 以 确信 ， 如 果子 树 的 平衡 因子 为 零 ， 那 么 祖先 节点 的 平 

衡 因 子 将 不 会 有 变化 。 

我 们 将 AVL 树 实现 为 BinarySearchTree 的 子 类 。 首 先 重 载 _put 方法 ， 然 后 新 写 

updateBalance 辅助 方法 ， 如 代码 清单 6-37 所 示 。 可 以 看 到 ， 除 了 在 第 8 行 和 第 15 行 调用 
updateBalance 以 外 ，_put 方法 的 定义 和 代码 清单 6-25 中 的 几乎 一 模 一 样 。 


代码 清单 6-37 更 新 平衡 因子 






































1 def put(self, key, val, currentNode): 

网 if key < _ currentNode .key : 

3 if _ currentNodqe .hasLeftCchild() : 

4 Self._put (key, val, currentNode.leftChild) 
§ else: 

6 currentNode.leftChild = TreeNode (key, val, 
3 parent=currentNode) 
8 self.updateBalance (currentNode.leftChild) 

9 else: 

10 if currentNode.hasRightChild(): 

图 self. put (key, val, currentNode.rightChild) 
12 else: 

13 currentNode.rightChild = TreeNode (key, val, 
14 parent=currentNode) 
于 与 self.updateBalance (currentNode.rightChild) 
16 

17 def updateBalance(self, node): 

18 if node.balanceFactor > 1 or node.balanceFactor < -1: 
9 self.rebalance (node) 

20 return 

21 if node.parent != None: 

22 if node.isLeftChild(): 

23 node.parent .balanceFactor += 1 

24 elif node.isRightChild(): 

25 node.parent .balanceFactor -= 1 

26 

27 if node.parent .balanceFactor != 0: 

28 self.updateBalance (node.parent) 





新 方法 updateBalance 做 了 大 部 分 工作 , 它 实现 了 前 面 描述 的 递归 过 程 。 updateBalance 
方法 先 检查 当前 节点 是 否 需 要 再 平衡 (第 18 行 )。 如 果 符 合 判 断 条 件 ， 就 进行 再 平衡 ,不 需要 更 
新 父 节点 ; 如 果 当 前 节点 不 需要 再 平衡 , 就 调整 父 节点 的 平衡 因子 。 如 果 父 节点 的 平衡 因子 非 夫 ， 
那么 沿 着 树 往 根 节 点 的 方向 递归 调用 updateBalance 方法 。 

如 果 需 要 进行 再 平衡 ， 该 怎么 做 呢 ? 高 效 的 再 平衡 是 让 AVL 树 发 挥 作用 同时 不 损 性 能 的 关 
键 。 为 了 让 AVL 树 恢 复 平 衡 ， 需 要 在 树 上 进行 一 次 或 多 次 旋转 。 
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要 理解 什么 是 旋转 ， 来 看 一 个 简单 的 例子 。 考 虑 图 6-28 中 左边 的 树 。 这 村 树 失衡 了 ， 平 稀 
因子 是 -2。 要 让 它 恢复 平衡 ,我 们 围绕 以 节点 A 为 根 节点 的 子 树 做 一 次 左旋 。 


= 


图 6-28 ”通过 左旋 让 失衡 的 树 恢复 平衡 

本 质 上 ， 左 旋 包 括 以 下 步 又 。 

口 将 右 子 节点 (节点 B ) 提升 为 子 树 的 根 节点 。 

口 将 旧 根 节点 (节点 A ) 作为 新 根 节点 的 左 子 节 点 。 

口 如 果 新 根 节点 (节点 B ) 已 经 有 一 个 左 子 节点 ， 将 其 作为 新 左 子 节 点 (节点 A ) 的 右 子 节 
点 。 注 意 ， 因 为 节点 B 之 前 是 节点 A 的 右 子 节 点 ， 所 以 此 时 节点 A 必然 没有 右 子 节点 。 
因此 ， 可 以 为 它 添加 新 的 右 子 节点 ， 而 无 须 过 多 考虑 。 

左旋 过 程 在 概念 上 很 简单 ,但 代码 细节 有 点 复杂 ， 因 为 需要 将 节点 挪 来 挪 去 ， 以 保证 二 又 搜 

索 树 的 性 质 。 另 外 ， 还 要 保证 正确 地 更 新 父 指 针 。 

我 们 来 看 一 棵 稍微 复杂 一 点 的 树 ， 并 理解 右 旋 过 程 。 图 6-29 左边 的 是 一 棵 左倾 的 树 ， 根 节 

点 的 平衡 因子 是 2。 右 旋 步 又 如 下 。 

口 将 左 子 节 点 (节点 C) 提升 为 子 树 的 根 节点 。 

口 将 旧 根 节点 (节点 E) 作为 新 根 节 点 的 右 子 节点 。 

口 如 果 新 根 节 点 (节点 C ) 已 经 有 一 个 右 子 节点 (节点 D )， 将 其 作为 新 右 子 节 点 (节点 EE) 
的 左 子 节点 。 注 意 ， 因 为 节点 C 之 前 是 节点 卫 的 左 子 节点 ， 所 以 此 时 节点 了 必然 没有 左 
子 节点 。 因 此 ， 可 以 为 它 添加 新 的 左 子 节点 ， 而 无 须 过 多 考虑 。 
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(0 


图 6-29 通过 右 旋 让 失衡 的 树 恢复 平衡 


了 解 旋转 的 基本 原理 之 后 ， 来 看 看 代码 。 代 码 清单 6-38 给 出 了 左旋 的 代码 。 第 2 行 创建 一 
个 临时 变量 ,用 于 记录 子 树 的 新 根 节 点 。 如 前 所 述 ， 新 根 节 点 是 旧 根 节点 的 右 子 节点 。 既 然 临 时 
变量 存储 了 指向 右 子 节点 的 引用 ， 便 可 以 将 旧 根 节点 的 右 子 节点 替换 为 新 根 节 点 的 左 子 节点 。 

下 一 步 是 调整 这 两 个 节点 的 父 指 针 。 如 果 新 根 节 点 有 左 子 节点 , 那么 这 个 左 子 节点 的 新 父 节 
点 就 是 旧 根 节点 。 将 新 根 节点 的 父 指针 指向 旧 根 节点 的 父 节点 。 如 果 旧 根 节点 是 整 棵 树 的 根 节点 ， 
那么 必须 将 树 的 根 节 点 设 为 新 根 节 点 ; 如 果 不 是 ， 则 当 旧 根 节 点 是 左 子 节 点 时 , 将 左 子 节 点 的 父 
指针 指向 新 根 节 点 ; 当 旧 根 节 点 是 右 子 节点 时 ,将 右 子 节点 的 父 指针 指向 新 根 节点 ( 第 10~13 行 )。 
最 后 ， 将 旧 根 节点 的 父 节点 设 为 新 根 节 点 。 这 一 系列 描述 很 复杂 ， 所 以 建议 你 根据 图 6-28 的 例 
子 运行 一 遍 函 数 。rotateRight 与 rotateLeft 对 称 ， 所 以 留 作 练习 。 


代码 清单 6-38 左旋 

































































名 def rotateLeft (self, rotRoot): 

2 newRoot = rotRoot.rightChild 

3 rotRoot.rightChild = newRoot.leftChild 
4 if newRoot.leftChild != None: 

3 newRoot.leftChild.parent = rotRoot 
6 

7 

8 

9 





newRoot .parent = rotRoot.parent 
if rotRoot.isRoot(): 
self.root = newRoot 
else: 
if rotRoot.isLeftChild(): 
rotRoot.parent.leftChild = newRoot 
else: 
rotRoot.parent.rightChild = newRoot 
newRoot .leftChild = rotRoot 
rotRoot.parent = newRoot 
rotRoot.balanceFactor = rotRoot.balanceFactor + 1 \ 
- min(newRoot .balanceFactor，0) 
newRoot .balanceFactor = DewRoot .balanceFactor + 1 \ 
+ max(rotRoot.balanceFactor, 0) 








OOO OPO 
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第 16~19 行 需要 特别 解释 一 下 。 这 几 行 更 新 了 旧 根 节点 和 新 根 节 点 的 平衡 因子 。 由 于 其 他 移 
动 操作 都 是 针对 整 棵 子 树 , 因此 旋转 后 其 他 节点 的 平衡 因子 都 不 受 影响 。 但 在 没有 完整 地 重新 计 
算 新 子 树 高 度 的 情况 下 ， 怎 么 能 更 新 平衡 因子 呢 ? 下 面 的 推导 过 程 能 证 明 ， 这 些 代码 是 对 的 。 


. 
A 
/A AAA J 


图 6-30 左旋 









































6-30 展示 了 左旋 结果 。B 和 D 是 关键 节点 ，A 、C、E 是 它们 的 子 树 。 针 对 根 节 点 为 x 的 
子 树 ， 将 其 高 度 记 为 h 。 由 定义 可 知 : 























newBal(B)=h, 一 人 
oldBal(B)=h,—h, 
D 的 旧 高 度 也 可 以 定义 为 1+ max(h.,h;) ， 即 D 的 高 度 等 于 两 棵 子 树 的 高 度 的 大 值 加 一 。 
为 有 与 不 变 ， 所 以 代入 第 2 个 等 式 ， 得 到 o14Ba1(B) = 有 一 QU+max(h,h,))。 然 后 ， 将 两 个 等 
式 相 减 ， 并 运用 代数 知识 简化 newBal1(B) 的 等 式 。 





newBal(B)—oldBal(B)=h,—h.—(h,—(l+max(h.,h;))) 
newBal(B)—oldBal(B)=h,—h,—h,+(l+max(h.,hs)) 
newBal(B)—oldBal(B)=h, -hy +1l+max(h.,h;)—h. 
newBal(B)—oldBal(B)=1+max(h.,h;)—h. 


下 面 将 o14Ba1(8) 移 到 等 式 右 边 ， 并 利用 性 质 max(a,b) -c=max(a 一 c,b 一 c) 得 到 : 








newBal(B)= oldBal(B)+1+max(h, —h,,h; —h.) 


由 于 有 一 及 就 等 于 -ol4Ba1(D) ， 因 此 可 以 利用 另 一 个 性 质 max(-a,-b) = -min(a,p) 。 最 后 几 
步 推 导 如 下 : 





newBal(B)= oldbal(B)+1+max(0,—oldBal(D)) 
newBal(B)= oldBal(B)+1—min(0,oldBal(D)) 


至 此 , 我 们 已 经 做 好 所 有 准备 了 。 如 果 还 记得 B 是 rotRoot 而 DD 是 newRoot, 那么 就 能 看 
到 以 上 等 式 对 应 于 代码 清单 6-38 中 的 第 16 行 : 























6.8 平衡 二 又 搜索 树 209 





rotRoot.balanceFactor = rotRoot.balanceFactor + 1 \ 
- minl(newRoot.balanceFactor, 0) 


通过 类 似 的 推导 , 可 以 得 到 节点 DD 的 等 式 , 以 及 右 旋 后 的 平衡 因子 。 这 个 推导 过 程 留 作 练习 。 


现在 你 可 能 认为 大 功 告 成 了 。 我 们 已 经 知道 如 何 左旋 和 右 旋 ， 也 知道 应 该 在 什么 时 候 旋转 ， 
但 请 看 看 图 6-31 节点 A 的 平衡 因子 为 -2, 应 该 做 一 次 左旋 。 但 是 , 围绕 节点 A 左旋 后 会 怎样 呢 ? 


图 6-31 更 难 平衡 的 树 
左旋 后 得 到 男 一 棵 失衡 的 树 , 如 图 6-32 所 示 。 如果 在 此 基础 上 做 一 次 右 旋 , 就 回 到 了 图 6-31 


的 状态 。 


图 6-32 ”左旋 后 ， 树 朝 另 一 个 方向 失衡 
要 解决 这 种 问题 ， 必 须 遵 循 以 下 规则 。 
口 如 果子 树 需 要 左旋 ， 首 先 检查 右 子 树 的 平衡 因子 。 如 有 果 右 子 树 左倾 ， 就 对 右 子 树 做 一 次 
右 旋 ， 再 围绕 原 节 点 做 一 次 左旋 。 
口 如 果子 树 需 要 右 旋 ， 首 先 检查 左 子 树 的 平衡 因子 。 如 果 左 子 树 右倾 ， 就 对 左 子 树 做 一 次 
左旋 ， 青 围绕 原 节点 做 一 次 右 旋 。 


图 6-33 展示 了 如 何 通过 以 上 规则 解决 图 6-31 和 图 6-32 中 的 困境 。 围 绕 节点 C 做 一 次 右 旋 ， 
了 围绕 节点 A 做 一 次 左旋 ， 就 能 让 子 树 恢复 平衡 。 
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一 8 一 了 


图 6-33” 先 右 旋 ， 再 左旋 


rebalance 方法 实现 了 上 述 规 则 ， 如 代码 清单 6-39 所 示 。 第 2 行 的 if 语句 实现 了 规则 1， 
第 8 行 的 elif 语句 实现 了 规则 2。 

在 6.11 节 中 , 你 将 尝试 通过 先 左 旋 再 右 旋 的 方式 恢复 一 棵 树 的 平衡 , 还 会 试 着 为 一 些 更 复杂 
的 树 恢复 平衡 。 


代码 清单 6-39 ”实现 再 平衡 





























def rebalance(self, node): 

2 if node.balanceFactor < 0: 

3 if node.rightChild.balanceFactor > 0: 
4 self.rotateRight (node.rightChild) 
5 self.rotateLeft (node) 

6 else: 
7 self.rotateLeft (node) 
8 elif node.balanceFactor > 0: 











9 if node.leftChild.balanceFactor < 0: 
10 self.rotateLeft (node.1leftChilgd) 
J self.rotateRight (node) 

12 else: 

3 self.rotateRight (node) 





通过 维持 树 的 平衡 ， 可 以 保证 get 方法 的 时 间 复 杂 度 为 O(log,n) 。 但 这 会 给 put 操作 的 性 
能 带 来 多 大 影响 呢 ? 我 们 来 看 看 put 操作 。 因 为 新 节点 作为 叶子 节点 插入 ， 所 以 更 新 所 有 父 方 
点 的 平衡 因子 最 多 需要 log 次 操作 一 一 每 一 层 一 次 。 如 果树 失衡 了 ， 恢 复 平衡 最 多 需要 旋转 两 
次 。 每 次 旋转 的 时 间 复 杂 度 是 0() ， 所 以 put 操作 的 时 间 复 杂 度 仍然 是 O(log,n) 。 

至 此 ， 我 们 已 经 实现 了 一 棵 可 用 的 AVL 树 ， 不 过 还 没有 实现 删除 节点 的 功能 。 我 们 将 删除 
市 点 及 后 续 的 更 新 和 再 平衡 的 实现 留 作 练 习 。 









































6.8.3 ”映射 实现 总 结 


本 章 和 第 5 章 介 绍 了 可 以 用 来 实现 映射 这 一 抽象 数据 类 型 的 多 种 数据 结构 ， 包 括 有 序列 表 、 
散 列 表 、 二 又 搜索 树 以 及 AVL 树 。 表 6-1 总 结 了 每 个 数据 结构 的 性 能 。 
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表 6-1 映射 的 不 同 实现 间 的 性 能 对 比 





有 序列 表 散 列表 二 又 搜索 树 AVL 树 

ou O(n) OU) O(n) O(log, n) 
get O(log, n) O00) O(n) O(log, n) 
in O(log, n) O00) O(n) O(log, n) 

Qe. O(n) OU) O(n) O(log, n) 


6.9 小 结 
本 章 介 绍 了 树 这 一 数据 结构 。 有 了 树 , 我 们 可 以 写 出 很 多 有 趣 的 算法 。 我 们 用 树 做 了 以 下 这 


些 事 。 

口 用 二 又 树 解 析 并 计算 表达 式 。 

口 用 二 又 树 实现 映射 。 

口 用 平衡 二 又 树 ( AVL 树 ) 实现 映射 。 
口 用 二 又 树 实现 最 小 堆 。 

口 用 最 小 堆 实 现 优先 级 队列 。 


6.10 ”关键 术语 











AVL 树 边 层 数 堆 的 有 序 性 
二 叉 堆 二 义 树 二 又 搜索 树 父 节 点 

高 度 根 节 点 后 继 节 点 后 序 遍历 
节点 路 径 前 序 遍 历 树 

完全 二 又 树 兄弟 节点 旋转 叶子 节点 
映射 优先 级 队列 中 序 遍 历 子 节点 
子 树 最 小 堆 / 最 大 堆 





6.11 讨论 题 
1， 画 出 下 列 函 数 调 用 后 的 树 结构 。 


>>> = BinaryTree(3) 
>>> insertLeft (r, 4) 


[3 ds a ds ~] 
>>> insertLeft (r, 5) 
LBs ES. di; .Ede:, El Ed),s: lll 


>>> insertRight (r, 6) 
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[3 和 < 泪 和 林 
>>> insertRight (r, 7) 
3 下 放下 3 下 可 革 
3 SEERooLVal {Lr 299 
>>> insertLeft (r, 11) 
[9, [11, [5, [4, C1, 0], [1, [1], [7, [], [6, [], []1]] 
2. 为 表达 式 (4 * 8) / 6 - 3 创建 对 应 的 表达 式 树 。 
3. 针对 整数 列表 [1，2，3，4，5，6，7，8，9，10]， 给 出 插入 列表 中 整数 得 到 的 二 
又 搜索 树 。 
4. 针对 整数 列表 [10，9，8，7，6，5，4，3，2，1]， 给 出 插入 列表 中 整数 得 到 的 二 
又 搜索 树 。 
5. 生成 一 个 随机 整数 列表 。 给 出 插入 列表 中 整数 得 到 的 二 又 堆 。 
6. 将 前 一 道 题 得 到 的 列表 作为 builaHeanp 方法 的 参数 ， 给 出 得 到 的 二 叉 堆 。 以 树 和 列表 
两 种 形式 展示 。 
7.， 夯 出 按 次 序 插入 这 些 键 之 后 的 二 又 搜索 树 : 68、88、61、89、94、50、4、76、66、82。 
8. 生成 一 个 随机 整数 列表 。 夯 出 插入 列表 中 整数 得 到 的 二 又 搜索 树 。 
9. 针对 整数 列表 [1，2，3，4，5，6，7，8，9，10]， 给 出 插入 列表 中 整数 得 到 的 二 
又 堆 。 
10， 针 对 整数 列表 [10，9，8，7，6，5，4，3，2，1]， 给 出 插入 列表 中 整数 得 到 的 二 又 堆 。 
11， 考虑 本 章 实现 二 又 树 的 两 种 方式 。 在 实现 为 方法 时 , 为 什么 必须 在 调用 preorder 前 检 


12， 给 出 构建 下 面 这 棵 二 又 树 所 需 的 函数 调用 。 





查 ， 而 在 实现 为 函数 时 ， 可 以 在 调用 内 部 检查 ? 





oe) 






13， 对 下 面 这 棵 树 ， 实 施 恢复 平衡 所 需 的 旋转 操作 。 


6.12 ”编程 练习 213 





， 以 图 6-30 作为 出 发 点 ， 推 导出 节点 D 在 更 新 后 的 平衡 因子 等 式 。 





编程 练习 

扩展 buildqaParseTree 方法 ， 使 其 能 处 处 理 字 符 间 没有 空格 的 数学 表达 式 。 

修改 buildParseTree 和 evaluate， 使 它们 支持 逻辑 运算 符 (and、or、not )。 注 
意 ，not 是 一 元 运算 符 ， 这 会 让 代码 有 点 复杂 。 

使 用 findsuccessor 方法 ， 写 一 个 非 递 归 的 二 又 搜索 树 中 序 遍 历 方法 。 


修改 二 又 搜 索 树 的 实现 代码 , 从 而 实现 线索 二 又 搜索 树 。 为 线索 二 又 搜索 树 写 一 个 非 弟 
归 的 中 序 遍 历 方法 。 线 索 二 又 搜索 树 为 其 中 的 每 个 节点 都 维护 着 指向 后 继 节 点 的 引用 。 


修改 二 又 搜索 树 的 实现 代码 ， 以 正确 处 理 重复 的 键 。 也 就 是 说 ， 如 果 键 已 在 树 中 ， 就 替 
换 有 效 载 答 ， 而 不 是 用 同一 个 键 插入 一 个 新 节点 。 

创建 限定 大 小 的 三 又 堆 。 也 就 是 说 ， 堆 只 保持 n 个 最 重要 的 元 素 。 如 果 堆 的 大 小 超过 了 
n， 就 会 舍弃 最 不 重要 的 元 素 。 


整理 printexp 函数 ， 去 掉 数 字 周 围 多 余 的 括号 。 
使 用 buildHeap 方法 ， 针 对 列表 写 一 个 时 间 复 杂 度 为 O(nlog nn) 的 排序 函数 。 
写 一 个 函数 ， 以 数学 表达 式 解 析 树 为 参数 ， 计 算 各 变量 的 导数 。 

































































.将 二 又 堆 实现 为 最 大 堆 。 


5 使 用 BinaryHeap 尖 : 实现 一 个 叫 作 PriorityQueue 的 新 类 。 为 PriorityQueue 





类 实现 构造 方法 ， 以 及 enqueue 方法 和 dequeue 方法 。 


， 实现 AVL 树 的 delete 方法 。 





yy 
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7.1 本 章 目标 


口 学 习 什么 是 图 以 及 如 何 使 用 图 。 
口 使 用 多 种 内 部 表示 实现 图 的 抽象 数据 类 型 。 
口 学 习 如 何 用 图 解决 众多 问题 。 


本 章 的 主题 是 图 。 与 第 6 章 介绍 的 树 相 比 ， 图 是 更 通用 的 结构 ; 事实 上 ， 可 以 把 树 看 作 一 种 
特殊 的 图 。 图 可 以 用 来 表示 现实 世界 中 很 多 有 意思 的 事物 ,包括 道路 系统 、 城 市 之 间 的 航班 、 互 
联网 的 连接 , 其 至 是 计算 机 专业 的 一 系列 必修 课 。 你 在 本 章 中 会 看 到 , 一 旦 有 了 很 好 的 表示 方法 ， 
就 可 以 用 一 些 标准 的 图 算法 来 解决 那些 看 起 来 非常 困难 的 问题 。 

尽管 我 们 能 够 轻易 看 懂 路 线 图 并 理解 其 中 不 同 地 点 之 间 的 关系 , 但 是 计算 机 并 不 具备 这 样 的 
能 力 。 不 过 , 我 们 也 可 以 将 路 线 图 看 成 是 一 张 图 , 从 而 使 计算 机 帮 我 们 做 一 些 非常 有 意思 的 事情 。 
用 过 互联 网 地 图 网 站 的 人 都 知道 , 计算 机 可 以 帮助 我 们 找到 两 地 之 间 最 短 、 最 快 、 最 便捷 的 路 线 。 

计算 机 专业 的 学 生 可 能 会 有 这 样 的 疑惑 : 自己 需要 学 习 哪 些 课程 才能 获得 学 位 呢 ? 图 可 以 很 
好 地 表示 课程 之 间 的 依赖 关系 。 图 7-1 展示 了 要 在 路 德 学 院 获 得 计算 机 科学 学 位 ， 所 需 学 习 课程 
的 先后 顺序 。 






















































































图 7-1 计算 机 课程 的 学 习 顺 序 
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7.2 术语 及 定义 


在 看 了 图 的 例子 之 后 , 现在 来 正式 地 定义 图 及 其 构成 。 从 对 树 的 学 习 中 ,我 们 已 经 知道 了 一 
些 术语 。 





顶点 又 称 节点 ， 是 图 的 基础 部 分 。 它 可 以 有 自己 的 名 字 ， 我 们 称 作 “ 键 "。 顶 点 也 可 以 带 有 
附加 信息 ， 我 们 称 作 “ 有 效 载荷 "。 

边 

边 是 图 的 另 一 个 基础 部 分 。 两 个 顶点 通过 一 条 边 相连 ,表示 它们 之 间 存 在 关系 。 边 既 可 以 是 
单 向 的 ， 也 可 以 是 双向 的 。 如 果 图 中 的 所 有 边 都 是 单 向 的 我们 称 之 为 有 向 图 。 图 7-1 明显 是 一 
个 有 向 图 ， 因 为 必须 修 完 某 些 课程 后 才能 修 后 续 的 课程 。 

权重 

边 可 以 带 权重 ,用 来 表示 从 一 个 顶点 到 男 一 个 项 点 的 成 本 。 例 如 在 路 线 图 中 ， 从 一 个 城市 到 
另 一 个 城市 ， 边 的 权重 可 以 表示 两 个 城市 之 间 的 距离 。 

有 了 上 述 定义 之 后 ， 就 可 以 正式 地 定义 图 。 图 可 以 用 G 来 表示 ,并 且 G = (KV 局。 其 中 , V 是 
一 个 顶点 集合 , 巨 是 一 个 边 集合 。 每 一 条 边 是 一 个 二 元 组 (y 沪 ， 其 中 wv eV。 可 以 向 边 的 二 元 组 
中 再 添加 一 个 元 素 , 用 于 表示 权重 。 子 图 s 是 一 个 由 边 。 和 项 点 "构成 的 集合 ,其 中 ec 已 且 vc 矿 。 

图 7-2 展示 了 一 个 简单 的 带 权 有 向 图 。 我 们 可 以 用 6 个 顶点 和 9 条 边 的 两 个 集合 来 正式 地 撒 
述 这 个 图 : 































































































V ={V0,V1,V2,V3,V4,V5} 
_ | C0,v1,5), (V1, v2, 4), (v2,v3,9), (v3, v4,7), (v4, v0, 1), 
| v0,v5,2), (v5, v4, 8), (v3, v5,3), (v5, v2,1) 





图 7-2 简单 的 带 权 有 向 图 
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7-2 中 的 例子 还 体现 了 其 他 两 个 重要 的 概念 。 
路 径 





路 径 是 由 边 连 接 的 顶点 组 成 的 序列 。 路 径 的 正式 定义 为 w,w,,…,w, ， 其 中 对 于 所 有 的 
1in-1, 有 (w,w,)e。 无 权重 路 径 的 长 度 是 路 径 上 的 边 数 ， 有 权重 路 径 的 长 度 是 路 径 上 


























的 边 的 权重 之 和 。 以 图 7-2 为 例 , 从 3 到 到 的 路 径 是 顶点 序列 (V3,V4,V0,V1) ， 相 应 的 边 是 
{ (v3,v4,7), (v4, v0,1), (v0, v1, 5) }。 

环 

环 是 有 疝 图 中 的 一 条 起 点 和 终点 为 同一 个 顶点 的 路 径 。 例 如 ,图 7-2 中 的 路 径 (V5,V2,V3,V5) 














就 是 一 个 环 。 没 有 环 的 图 被 称 为 无 环 图 ， 没 有 环 的 有 向 图 被 称 为 有 向 无 环 图 ， 简 称 为 DAG。 接 





下 来 会 看 到 ，DAG 能 帮助 我 们 解决 很 多 重要 的 问题 。 


7.3 图 的 抽象 数据 类 型 
图 的 抽象 数据 类 型 由 下 列 方法 定义 。 


口 Graph () 新建 一 个 空 图 。 
口 addVertex (vert) 问 图 中 添加 一 个 项 点 实例 。 














于 连接 顶点 fromVert 和 tovVert。 





口 getVertices() 以 列表 形式 返回 图 中 所 有 顶点 。 



































口 aqaqEdoge (fromVert，tovVert) 向 图 中 添加 一 条 有 向 边 ， 用 于 连接 顶点 fromvert 和 tovert。 
口 addEdge (fromVert,，toVert, weight) 向 图 中 添加 一 条 带 权 重 weight 的 有 向 边 ， 用 


口 getVertex (vertKey) 在 图 中 找到 名 为 vertKey 的 顶点 。 


口 in 通过 vertex in graph 这 样 的 语句 ， 在 顶点 存在 时 返回 True， 否 则 返回 False。 


根据 图 的 正式 定义 ， 可 以 通过 多 种 方式 在 Python 中 实现 图 的 抽象 数据 类 型 。 你 会 看 到 ， 在 
使 用 不 同 的 表达 方式 来 实现 图 的 抽象 数据 类 型 时 ， 需 要 做 很 多 取舍 。 有 两 种 非常 著名 的 图 实现 ， 














它们 分 别 是 邻接 矩阵 和 邻接 表 。 本 届 会 解释 这 两 种 实现 ， 并 | 





7.3.1 邻接 矩阵 


目 上 月 





日 Python 类 来 实现 邻接 表 。 


要 实现 图 ,最 简单 的 方式 就 是 使 用 二 维和 矩阵 。 在 和 矩阵 实现 中 ,每 一 行 和 每 一 列 都 表示 图 中 的 
一 个 顶点 。 第 vy 行 和 第 w 列 交叉 的 格子 中 的 值 表示 从 顶点 v 到 顶点 w 的 边 的 权重 。 如果 两 个 顶点 
被 一 条 边 连接 起 来 ， 就 称 它们 是 相 邻 的 。 图 7-3 展示 了 图 7-2 对 应 的 邻接 矩阵 。 格 子 中 的 值 表示 
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Vo Vl V2 V3 V4 V5 





VO 3 2 





V1 4 











V2 9 

V3 全 3 
V4 1 

V5 1 8 























图 7-3 ”邻接 年 阵 示例 

邻接 矩阵 的 优点 是 简单 。 对 于 小 图 来 说 , 邻接 矩阵 可 以 清晰 地 展示 哪些 顶点 是 相连 的 。 但 是 ， 
7-3 中 的 绝 大 多 数 单元 格 是 空 的 ， 我 们 称 这 种 和 矩阵 是 “ 稀 芍 ”的 。 对 于 存储 稀 琉 数据 来 说 ， 拢 
阵 并 不 高 效 。 事 实 上 ， 要 在 Python 中 创建 如 图 7-3 所 示 的 矩阵 结构 并 不 容易 。 

邻接 矩阵 适用 于 表示 有 很 多 条 边 的 图 。 但 是 ,“ 很 多 条 边 ” 具 体 是 什么 意思 呢 ? 要 填 满 矩阵 ， 
共 需 要 多 少 条 边 ? 由 于 每 一 行 和 每 一 列 对 应 图 中 的 每 一 个 顶点 ， 因此 填 满 矩阵 共 需 要 | 让 条 边 。 
当 每 一 个 顶点 都 与 其 他 所 有 顶点 相连 时 ,和 矩阵 就 被 填 满 了 。 在 现实 世界 中 , 很 少 有 问题 能 够 达到 
这 种 连接 度 。 本 章 所 探讨 的 问题 都 会 用 到 稀疏 连接 的 图 。 




































































7.3.2 ”邻接 表 

为 了 实现 稀 玻 连接 的 图 ,更 高 效 的 方式 是 使 用 邻接 表 。 在 邻接 表 实 现 中 , 我 们 为 图 对 象 的 所 
有 顶点 保存 一 个 主 列表 ， 同 时 为 每 一 个 顶点 对 象 都 维护 一 个 列表 ， 其 中 记录 了 与 它 相连 的 顶点 。 
在 对 vertex 类 的 实现 中 ,我们 使 用 字典 ( 而 不 是 列表 )， 字 典 的 键 是 顶点 ， 值 是 权重 。 图 7-4 
展示 了 图 7-2 所 对 应 的 邻接 表 。 
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vertList 
V0 > id = "VO" 
J YL 
id = "V1" 
V1 ”| adj= { V2:4 } 
id = "V2" 
V2 | adj= { V3:9 } 
顶点 对 象 
id = "V3" 
V3 ”| dT 直人， 区/ 玫 
V4 | id = "V4" 
adj= { V0:1 } 
V5 | id = "V5" 
adj= { V2:1, V4:8 } 
numVertices = 6 
图 7-4 ”邻接 表示 例 

















邻接 表 的 优点 是 能 够 紧凑 地 表示 稀 玻 图 。 此 外 ,邻接 表 也 有 助 于 方便 地 找到 与 某 一 个 顶点 相 


连 的 其 他 所 有 顶点 。 


7.3.3 ”实现 


在 Python 中 ， 通 过 字典 可 以 轻松 地 实现 邻接 表 。 我 们 要 创建 两 个 类 : Graph 类 存储 包含 所 
有 顶点 的 主 列表 ， Vertex 类 表示 图 中 的 每 一 个 顶点 。 


Vertex 使 用 字典 connectedTo 来 记录 与 其 相连 的 顶点， 以 及 每 一 条 边 的 权重 。 代 码 清单 





7-1 展示 了 Vertex 类 的 实现 ， 其 构造 方法 简单 地 初始 化 ia( 它 通常 





























个 字符 串 )， 以 及 字典 


帅 征 


connectedTo。 aqqNeighbor 方法 添加 从 一 个 顶点 到 男 一 个 的 连接 。getconnections 方法 返 
回 邻 接 表 中 的 所 有 顶点 ， 由 connectedTo 来 表示 。getweight 方法 返回 从 当前 顶点 到 以 参数 


传人 的 顶点 之 间 的 边 的 权重 。 
代码 清单 7-1 


Vertex 类 





1 class Vertex: 

和 2 def _ init__ (self, key): 

3 self.iqd = key 

4 self.connectedTo = {} 

5 

6 def addNeighbor (self, nbr, weight=0): 

7 self.connectedTo[nbr] = weight 

8 

9 def __str__(self): 

10 return str(self.id) + ' connectedTo: ' 
J] 污 + str([x.iqd for x in self.connectedTo]) 
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12 
13 def getConnections (self): 
14 return self.connectedTo.keys() 
15 
16 def getIdl(self): 
7 return self.id 
18 
19 def getWeight (self, nbr): 
20 return self.connectedTo [nbr] 
Graph 类 的 实现 如 代码 清单 7-2 所 示 ， 其 中 包含 一 个 将 顶点 名 映射 到 顶点 对 象 的 字典 。 在 图 
7-4 中, 该 字典 对 象 由 灰色 方块 表示 。Graph 类 也 提供 了 向 图 中 添加 顶点 和 连接 不 同 顶 点 的 方法 。 


getVertices 方法 返回 图 中 所 有 顶点 的 名 字 。 此 外 ， 我 们 还 实现 了 __iter_ 方法 , 从 而 使 遍历 
图 中 的 所 有 顶点 对 象 更 加 方便 。 总 之, 这 两 个 方法 使 我 们 能 够 根据 顶点 名 或 者 顶点 对 象 本 身 遍 历 
图 中 的 所 有 顶点 。 


代码 清单 7-2 ”Graph 类 








class Graph : 
def _ init (selft) : 
self.vertList = {} 
self.numVertices = 0 


def addVertex(self, key): 
self.numVertices = self.numVertices + 1 
newVertex = Vertex(key) 
self.vertList[key] = newVertex 
return newVertex 


1 
2 
2 
4 
3 
6 
7 
8 
9 


def getVertex(self, n): 
if n in self.vertList: 
return self.vertListl[n] 
else: 
return None 





def _ contains,_(self, n): 
return n in self.vertList 





def addEdge(self, f, t, cost=0): 
if f not in self.vertList: 
nv = self.addVertex(f) 

if t not in self.vertList 
nv = self.addVertex(t) 
self.vertList[f] .addNeighbor (self.vertList[t], cost) 


人 
NUnwNDOoo~ QU 忆 wwNDP 用 品 











py 

28 

29 def getVertices (self): 

30 return self.vertList.keys() 

3 

32 def _ iter_ (self): 

3 return iter(self.vertList.values() 
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下 面 的 Python 会 话 使 用 Graph 类 和 vertex 类 创建 了 如 图 7-2 所 示 的 图 。 首 先 创建 6 个 项 
点 ,依次 编号 为 0~5。 然 后 打印 顶点 字典 。 注 意 , 对 每 一 个 键 , 我 们 都 创建 了 一 个 Vertex 实例 。 
接着 ,添加 将 项 点 连接 起 来 的 边 。 最 后 ， 用 一 个 藤 套 循环 验证 图 中 的 每 一 条 边 都 已 被 正确 存储 。 




















>>> 9g = Graph() 

>>> for i in range(6 
g.addVertex(i 

>>> g.vertList 

{0: <adjGraph.Vertex 

1: <adjGraph.Vertex 

2: <adjGraph.Vertex 

3: <adjGraph.Vertex 

4: <adjGraph.Vertex 

5: <adjGraph.Vertex 


>>> g.addEdge(0, 1, 
>>> g.addEdge(0, 5, 
>>> g.addEdge(1, 2, 
>>> g.addEdge (2, 3, 
>>> g.addEdge(3, 4, 
>>> g.addEdge(3, 5, 
>>> g.addEdge(4, 0, 
>>> g.addEdge(5, 4, 
>>> g.addEdge (5, 2, 
>>> for V in g: 








J 
) 


instance 
instance 
instance 
instance 
instance 
instance 


a 
at 
at 
at 
at 
at 








请 按照 图 7-2 的 内 容 检查 会 话 的 最 终结 果 。 


0x41e18>， 
0x7f2b0>, 
0x7f288>, 
0x7f350>， 
0X7E3285， 
0x7f300>} 


for w in v.getConnections(): 


BETnt (Tt 


URWW OPOD 
DAOUUUPRODODPU 


3 


7.4 宽度 优先 搜索 


7.4.1 词 梯 问 题 


%sS ; %S8 )}" 


o 
五 





(v.getId(), w.getId())) 


我 们 从 词 梯 问 题 开 始 学 习 图 算法 。 考 虑 这 样 一 个 任务 : 将 单词 FOOL 转换 成 SAGE。 在 解决 


词 梯 问 题 时 ， 必 须 每 次 只 替换 








个 字母 ,并 且 每 一 步 的 结果 都 必须 是 一 个 单词 ， 而 不 能 是 不 存在 








的 词 。 词 梯 问 题 由 《爱丽 丝 梦 游 仙境 》 的 作者 刘易斯 ， 卡 罗 尔 于 1878 年 提出 。 下 面 的 单词 转换 


序列 是 样 例 问题 的 一 个 解 。 
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FOOL 
POOL 
POLL 
POLE 
PALE 
SALE 
SAGE 
词 梯 问题 有 很 多 变 体 ,例如 在 给 定 步 数 内 完成 转换 , 或 者 必须 用 到 某 个 单词 。 在 本 节 中 ,， 我 
们 研究 从 起 始 单 词 转 换 到 结束 单词 所 需 的 最 小 步 数 。 
由 于 本 章 的 主题 是 图 ， 因 此 我 们 自然 会 想到 使 用 图 算法 来 解决 这 个 问题 。 以 下 是 大 致 步 又 ; 
口 用 图 表示 单词 之 间 的 关系 ; 
口 用 一 种 名 为 宽度 优先 搜索 的 图 算法 找到 从 起 始 单词 到 结束 单词 的 最 短路 径 。 
7.4.2 构建 词 梯 图 
第 一 个 问题 是 如 何 用 图 来 表示 大 的 单词 集合 。 如 果 两 个 单词 的 区 别 仅 在 于 有 一 个 不 同 的 字 
母 ， 就 用 一 条 边 将 它们 相连 。 如 果 能 创建 这 样 一 个 图 , 那么 其 中 的 任意 一 条 连接 两 个 单词 的 路 径 
就 是 词 梯 问 题 的 一 个 解 。 图 7-5 展示 了 一 个 小 型 图 ， 可 用 于 解决 从 FOOL 到 SAGE 的 词 梯 问题 。 
注意 ， 它 是 无 向 图 ， 并 且 边 没有 权重 。 


fail 
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fall 





foil pall pope 


sale 


ee 


sage 
fool poll ~ 二 
WW page 


pool 
图 7-5 用 于 解决 词 梯 问 题 的 小 型 图 


创建 这 个 图 有 多 种 方式 。 假 设 有 一 个 单词 列表 ,其 中 每 个 单词 的 长 度 都 相同 。 首先, 为 每 个 
单词 创建 顶点。 为 了 连接 这 些 顶 点 , 可 以 将 每 个 单词 与 列表 中 的 其 他 所 有 单词 进行 比较 。 如 果 两 
个 单词 只 相差 一 个 字母 , 就 可 以 在 图 中 创建 一 条 边 , 将 它们 连接 起 来 。 对 于 只 有 少量 单词 的 情况 ， 
这 个 算法 还 不 错 。 但 是 ,假设 列表 中 有 5110 个 单词 ， 将 一 个 单词 与 列表 中 的 其 他 所 有 单词 进行 


foul pole 

















cool 
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比较 ， 时 间 复 杂 度 为 O(n*) 。 对 于 5110 个 单词 来 说 ， 这 意味 着 要 进行 2600 多 万 次 比较 。 
采用 下 述 方 法 ,可 以 更 高 效 地 构建 这 个 关系 图 。 假设 有 数目 巨大 的 桶 ,每 一 个 桶 上 都 标 有 一 

个 长 度 为 4 的 单词 ， 但 是 某 一 个 字母 被 下 划 线 代替 。 图 7-6 展示 了 一 些 例子 ， 如 POP_。 当 处 理 

列表 中 的 每 一 个 单词 时 , 将 它 与 桶 上 的 标签 进行 比较 。 使 用 下 划 线 作为 通配符 ,我 们 将 POPE 和 
































POPS 放 入 同一 个 桶 中 。 一 旦 将 所 有 单词 都 放 入 对 应 的 桶 中 之 后 ， 我 们 就 知道 ， 

















词 一 定 是 相连 的 。 


POPE POPE POPE POPE 
ROPE PIPE POLE POPS 
NOPE PAPE PORE 

HOPE POSE 

LOPE POKE 

MOPE 

COPE 


图 7-6 词 桶 示例 





























同一 个 桶 中 的 单 





在 Python 中 ， 可 以 通过 字典 来 实现 上 述 方法 。 字 典 的 键 就 是 桶 上 的 标签 ， 值 就 是 对 应 的 单 
词 列表 。 一 旦 构建 好 字典 ,就 能 利用 它 来 创建 图 。 首 先 为 每 个 单词 创建 项 点 ,然后 在 字典 中 对 应 





同一 个 键 的 单词 之 间 创 建 边 。 代 码 清单 7-3 展示 了 构建 图 所 需 的 Python 代码 。 
代码 清单 7-3 ”为 词 梯 问 题 构建 单词 关系 图 





1 from pythonds.graphs import Graph 
必 def buildGraph (wordFile): 
3 d= (3 
4 g = Graph() 
5 wfile = open(wordFile, 'r') 
6 # 创建 词 桶 
7 for line in wfile: 
8 word = line [:-1] 
9 for i in range(len (word)): 
bucket = word[:i] + '_' + word[i+1:] 
if bucket in d: 
d[bucket] .append (word) 
else: 
d[bucket] = [word] 
# 为 同一 个 桶 中 的 单词 添加 顶点 和 边 
for bucket in d.keys(): 
for wordl1 in Q[bucket]: 
for word2 in Q[bucket]: 
if word1 != word2 : 
g.addEdge (word1，word2 ) 





卢 品 \ 避 oo~OQUm 必 ww 忆 品 


CD NI 


return g 
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这 是 我 们 在 本 节 中 遇 到 的 第 一 个 实际 的 图 问题 ,你 可 能 会 好 奇 这 个 网 的 稀 玻 程度 如 何 。 本 例 
中 的 单词 列表 包含 $110 个 单词 。 如 果 使 用 邻接 矩阵 表示 ， 就 会 有 26 112 100 个 单元 格 (5110 * 
5110 = 26 112 100 )。 用 buildGraph 函数 创建 的 图 一 共有 53 286 条 边 。 因 此 ， 只 有 0.2% 的 
单元 格 被 填充 。 这 显然 是 一 个 非常 稀 玖 的 矩阵 。 











7.4.3 ”实现 宽度 优先 搜索 


完成 图 的 构建 之 后 , 就 可 以 编写 能 帮 我 们 找到 最 短路 径 的 图 算法 。 我 们 使 用 的 算法 叫 作 宽度 
优先 搜索 ( breadth first search， 以 下 简称 BFS )。BFS 是 最 简单 的 图 搜索 算法 之 一 ， 也 是 后 续 要 
介绍 的 其 他 重要 图 算法 的 原型 。 

给 定 图 G 和 起 点 s，BFS 通过 边 来 访问 在 G 中 与 s 之 间 存 在 路 径 的 项 点 。BFS 的 一 个 重要 特 
性 是 ， 它 会 在 访问 完 所 有 与 s 相距 为 的 顶点 之 后 再 去 访问 与 s 相距 为 ttl1 的 顶点 。 为 了 理解 这 
种 搜索 行为 ， 可 以 想象 BFS 以 每 次 生成 一 层 的 方式 构建 一 棵 树 。 它 会 在 访问 任意 一 个 孙 节 点 之 
前 将 起 点 的 所 有 子 节 点 都 添加 进来 。 

为 了 记录 进度 ，BFS 会 将 顶点 标记 成 白色 、 灰 色 或 黑色 。 在 构建 时 ， 所 有 顶点 都 被 初始 化 成 
白色 。 白 色 代 表 该 项 点 没有 被 访问 过 。 当 顶点 第 一 次 被 访问 时 ， 它 就 会 被 标记 为 灰色 ; 当 BFS 
完成 对 该 顶点 的 访问 之 后 , 它 就 会 被 标记 为 黑色 。 这 意味 着 一 旦 顶点 变 为 黑色 ， 就 没有 白色 顶点 
与 之 相连 。 灰 色 顶 点 仍然 可 能 与 一 些 白色 顶点 相连 ， 这 意味 着 还 有 额外 的 顶点 可 以 访问 。 

在 代码 清单 7-4 中 ，BFS 使 用 7.3.3 节 实 现 的 邻接 表 来 表示 图 。 它 还 使 用 oueue 来 决定 后 续 
要 访问 的 顶点 ， 我 们 会 了 解 到 其 重要 性 。 


代码 清单 7-4 ”宽度 优先 搜索 





































































































1 from pythonds.graphs import Graph, Vertex 

2 from pythonds.basic import Queue 

3 def pfs(g, start): 

4 start.setDistance(0) 

5 start.setPred (None) 

6 VertQueue = Queue () 

7 VertoOoueue .endueue (start) 

8 while (vertQueue.size() > 0) : 

9 currentVert = VertQueue.dqecueue () 

10 for nbr in currentVert .getConnections () : 
二 if (nbr.getColor() == 'white') : 

12 nbr.setColor('gray') 

13 nbr.setDistance (currentVert.getDistance() + 1) 
14 nbr.setPred(currentVert) 

15 Vertoueue .endueue (nbr) 

下 和 currentVert.setColor('black') 





除 此 以 外 , BFS 还 使 用 了 vertex 类 的 扩展 版 本 。 这 个 新 的 Vertex 类 新 增 了 3 个 实例 变量 : 
distance、predecessor 和 color。 每 一 个 变量 都 有 对 应 的 getter 方法 和 setter 方法。 扩展 后 
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的 Vertex 类 被 包含 在 pythonds 包 中 。 因 为 其 中 没有 新 的 知识 点 ， 所 以 此 处 不 展示 这 个 类 。 


BFS 从 起 点 s 开始 ， 将 它 标记 为 灰色 ， 以 表示 正在 访问 它 。 另 外 两 个 变量 ，daistance 和 
predecessor， 被 分 别 初始 化 为 0 和 None。 随 后 ，start 被 放 入 oueue 中 。 下 一 步 是 系统 化 
地 访问 位 于 队列 头 部 的 顶点 。 我 们 通过 遍历 邻接 表 来 访问 新 的 顶点 。 在 访问 每 一 个 新 顶点 时 ,都 
会 检查 它 的 颜色 。 如 果 是 白色 ， 说 明 顶 点 没有 被 访问 过 ， 那 么 就 执行 以 下 4 步 。 

(1) 将 新 的 未 访问 顶点 nbz 标记 成 灰色 。 


(2) 将 nbr 的 predecessor 设置 成 当前 顶点 currentVert。 








(3) 将 npr 的 distance 设置 成 到 currentVert 的 distance 加 1。 

(4) 将 nbr 添加 到 队列 的 尾部 。 这 样 做 为 之 后 访问 该 顶点 做 好 了 准备 。 但 是 ， 要 等 到 
currentVert 邻接 表 中 的 所 有 其 他 顶点 都 被 访问 之 后 才能 访问 该 顶点。 

来 看 看 bfs 函数 如 何 构 建 对 应 于 图 7-5 的 宽度 优先 搜索 树 。 从 顶点 fool 开始 , 将 所 有 与 之 相 
连 的 顶点 都 添加 到 树 中 。 相 邻 的 顶点 有 pool、foil、foul， 以 及 cool。 它们 都 被 添加 到 队列 中 ， 作 




















ie 


队列 | pool | foil | foul | cool 





图 7-7 宽度 优先 搜索 的 第 1 步 


接 下 来 ，bfs 函数 从 队列 头 部 移 除 下 一 个 顶点 〈pool ) 并 对 它 的 邻接 项 点 重复 之 前 的 过 程 。 
但 是 , 当 检 查 cool 的 时 候 , pfs 函数 发 现 它 的 颜色 已 经 被 标记 为 了 灰色 。 这 意味 着 从 起 点 到 cool 
有 一 条 更 短 的 路 径 ， 并 且 cool 已 经 被 添加 到 了 队列 中 。 图 7-8 展示 了 树 和 队列 的 新 状态 。 
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队列 foil foul cool poll 





图 7-8 ”宽度 优先 搜索 的 第 2 步 


队列 中 的 下 一 个 顶点 是 foil。 唯 一 能 添加 的 新 顶点 是 fail。 当 bfs 函数 继续 处 理 队 列 时 ， 后 
面 的 两 个 顶点 都 没有 可 供 添 加 到 队列 和 树 中 的 新 顶点 。 图 7-9a 展示 了 树 和 队列 在 扩展 了 第 2 层 
之 后 的 状态 。 

请 继续 研究 bfs 函数 ， 直 到 能 够 理解 其 原理 为 止 。 图 7-9b 展示 了 访问 完 图 7-5 中 所 有 顶点 
之 后 的 宽度 优先 搜索 树 。 非 常 神 奇 的 一 点 是 ,我 们 不 仅 解决 了 一 开始 提出 的 从 FOOL 转换 成 SAGE 
的 问题 ， 同 时 也 解决 了 许多 其 他 问题 。 可 以 从 宽度 优先 搜索 树 中 的 任意 节点 开始 ， 跟 随 
predecessor 回溯 到 根 节 点 ， 以 此 来 找到 任意 单词 到 fool 的 最 短 词 梯 。 代 码 清单 7-5 中 的 函数 
展示 了 如 何 通过 回溯 predecessor 链 来 打印 整个 词 梯 。 



























































队列 pole 


(a) 扩展 到 第 2 层 的 树 (b) 树 的 最 终 状态 
图 7-9 构建 宽度 优先 搜索 树 
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代码 清单 7-5 ”回溯 宽度 优先 搜索 树 





1 def traversel(y): 

2 x YY 

2 while (x.getPred()): 
4 print (x.getId()) 
SS x = x.getPpred!() 
6 print (x.getId()) 

7 

8 


traverse(g.getVertex('sage')) 





7.4.4 ”分 析 宽 度 优先 搜索 
在 学 习 其 他 图 算法 之 前 ， 让 我 们 先 分 析 BFS 的 性 能 。 在 代码 清单 74 中 , 第 8 行 的 while 








这 使 得 while 循环 的 时 间 复 杂 度 是 O(V) 。 至 于 般 套 在 while 循环 中 的 for 循环 (第 10 行 )， 
它 对 每 一 条 边 都 最 多 只 会 执行 一 次 。 原 因 是 ,每 一 个 顶点 最 多 只 会 出 列 一 次 , 并 且 我 们 只 有 在 项 
点 出 列 时 才 会 访问 从 ww 到 v 的 边 。 这 使 得 for 循环 的 时 间 复 杂 度 为 O(E) 。 因 此 ， 两 个 循环 总 
的 时 间 复 杂 度 就 是 O(V + EE) 。 

进行 宽度 优先 搜索 只 是 整个 任务 的 一 部 分 , 从 起 点 一 直 找 到 终点 则 是 任务 的 男 一 部 分 。 这 部 
分 的 最 坏 情 况 是 整个 图 是 一 条 长 链 。 在 这 种 情况 下 ， 遍历 所 有 顶点 的 时 间 复 杂 度 是 O(V) 。 正 常 
情况 下 ， 时 间 复 杂 度 等 于 O(7Y) 乘 以 某 个 小 数 ， 但 是 我 们 仍然 用 O(7) 来 表示 。 

最 后 ， 对 于 本 节 的 问题 来 说 ， 还 需要 时 间 构 建 初始 图 。 我 们 将 builacraph 函数 的 时 间 复 
杂 度 分 析 留 作 练习 。 


7.5 深度 优先 搜索 


7.5.1 骑士 周游 问题 


男 一 个 经 典 问题 是 骑 十 周游 问题 , 我 们 用 它 来 说 明 第 2 种 常见 的 图 算法 。 为 了 解决 骑士 周游 
问题 ， 我 们 取 一 块 国际 象棋 棋盘 和 一 颗 骑 十 棋子 ( 马 )。 目标 是 找到 一 系列 走 法 ， 使 得 骑士 对 棋 
盘 上 的 每 一 格 刚好 都 只 访问 一 次 。 这 样 的 一 个 移动 序列 被 称 为 “周游 路 径 ”。 多 年 来 ， 骑 士 周 游 
问题 吸引 了 众多 棋 手 、 数 学 家 和 计算 机 科学 家 。 对 于 8x8 的 棋盘 ， 周 游 数 的 上 界 是 1.305x10”， 
但 死路 更 多 。 很 明显 ， 解 决 这 个 问题 需要 聪明 人 或 者 强大 的 计算 能 力 ， 抑 或 兼 具 二 者 。 

尽管 人 们 研究 出 很 多 种 算法 来 解决 骑士 周游 问题 , 但 是 图 搜索 算法 是 其 中 最 好 理解 和 最 易 编 
程 的 一 种 。 我 们 再 一 次 通过 两 步 来 解决 这 个 问题 ; 

口 用 图 表示 骑士 在 棋盘 上 的 合理 走 法 ; 
口 使 用 图 算法 找到 一 条 长 度 为 rows xcolumns -1 的 路 径 ， 满 足 图 中 的 每 一 个 顶点 都 只 被 访 
问 一 次 。 
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7.5.2 构建 骑士 周游 图 


为 了 用 图 表示 骑士 周游 问题 , 我 们 将 棋盘 上 的 每 一 格 表示 为 一 个 项 点， 同时 将 骑士 的 每 一 次 
合理 走 法 表示 为 一 条 边 。 图 7-10 展示 了 骑士 的 合理 走 法 以 及 在 图 中 对 应 的 边 。 








图 7-10 ”骑士 的 合理 走 法 以 及 在 图 中 对 应 的 边 


可 以 用 代码 清单 7-6 中 的 Python 函数 来 构建 nxn 棋盘 对 应 的 完整 图 。knightGraph 函数 
将 整个 棋盘 遍历 了 一 遍 。 当 它 访问 棋盘 上 的 每 一 格 时 ,都 会 调用 辅助 函数 genLegalMoves 来 
创建 一 个 列表 ， 用 于 记录 从 这 一 格 开始 的 所 有 合理 走 法 。 之 后 ， 所 有 的 合理 走 法 都 被 转换 成 图 
中 的 边 。 另 一 个 辅助 函数 posToNoaeria 将 棋盘 上 的 行列 位 置 转换 成 与 图 7-10 中 顶点 编号 相似 
的 线性 顶点 数 。 


代码 清单 7-6” ”knightGraph 限 数 








1 from pythonds.graphs import Graph 
人 def knightGraph (bdSize): 

3 ktGraph = Graph() 

4 for row in range (bdSize): 

5 for col in range (bdSize): 
6 nodeId = posToNodeId(row, col, bdSize) 
J 

8 

9 

1 

1 


newPositions = genLegalMoves (row, col, bdSize) 7 
for e in newPositions: 


nid = posToNodeId(e[0], el[1]) 





0 ktGraph.addEdge (nodeId, nid) 
1 return ktGraph 





在 代码 清单 7-7 中 ，genLegalMoves 函数 接受 骑士 在 棋盘 上 的 位 置 ， 并且 生 成 8 种 可 能 的 
走 法 。1legalCoord 辅助 函数 确认 走 法 是 合理 的 。 
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代码 清单 7-7 genLegalMoves 图 数 和 1egalCoorg 函数 



































1 def genLegalMoves (x, y, bdSize): 
2 newMoves = [] 
3 moveOoffsets = [(-1, -2), (-1, 2) (2 SL) (=2 1) 
4 (i (2 SL) (这 ;a 了 
5 for i in moveOffsets: 
6 DewX = X+ 1i[0] 
7 newY =y + i[1] 
8 if legalCoord (newX, bdSize) and \ 
9 legalCoord (newY, bdSize): 
10 newMoves .append( (newX, newY)) 
开业 return newMoves 
工 2 
13 def legalCoord(x, bdSize): 
14 if x >= 0 and x < bdSize: 
下 党 return True 
16 else: 
17 return False 
7-11 展示 了 在 8x8 的 棋盘 上 所 有 合理 走 法 所 对 应 的 完整 图 ， 其 中 一 共有 336 条 边 。 注 意 ， 
与 棋盘 中 间 的 顶点 相 比 ， 边缘 硕 点 的 连接 更 少 。 可 以 看 到 ， 这 个 图 也 是 非常 稀 玖 的 。 如 果 图 是 完 


全 相连 的 ， 那 么 会 有 4096 条 边 。 由 了 
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图 7-11 
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8x8 的 棋盘 上 所 有 合 到 


FF 本 网 只 有 336 条 边 ， 因 此 邻接 矩阵 的 填充 率 只 有 8.2%。 
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E 走 法 所 对 应 的 完整 图 
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7.5.3 ”实现 骑士 周游 


用 来 解决 骑士 周游 问题 的 搜索 算法 叫 作 深 度 优先 搜索 ( depth first search， 以 下 简称 DFS )。 
与 BFS 每 次 构建 一 层 不 同 ，DFS 通过 尽 可 能 深 地 探索 分 支 来 构建 搜索 树 。 本 节 将 探讨 DFS 的 2 
种 实现 : 第 1 种 通过 显 式 地 禁止 顶点 被 多 次 访问 来 直接 解决 骑士 周游 问题 ; 第 2 种 更 通用 , 它 在 
构建 搜索 树 时 允许 其 中 的 顶点 被 多 次 访问 。 本 章 稍 后 将 利用 第 2 种 实现 开发 其 他 的 图 算法 。 

DFS 正 是 为 找到 由 63 条 边 构 成 的 路 径 所 需 的 算法 。 我 们 会 看 到 ， 当 DFS 遇 到 死路 时 (无 法 
找到 下 一 个 合理 走 法 )， 它 会 回 退 到 树 中 倒数 第 2 深 的 顶点 ， 以 继续 移动 。 

在 代码 清单 7-8 中 ，knightTour 函数 接受 4 个 参数 : n 是 搜索 树 的 当前 深度 ; path 是 到 当 
前 为 止 访问 过 的 顶点 列表 ; u 是 希望 在 图 中 访问 的 顶点 ; limit 是 路 径 上 的 顶点 总 数 。 
knightTour 函数 是 递归 的 。 当 被 调用 时 ， 它 首先 检查 基本 情况 。 如 果 有 一 条 包含 64 个 顶点 的 
路 径 ， 就 从 knightTour 返回 True， 以 表示 找到 了 一 次 成 功 的 周游 。 如 果 路 径 不 够 长 ， 则 通过 
选择 一 个 新 的 访问 顶点 并 对 其 递归 调用 knightTour 来 进行 更 深 一 层 的 探索 。 


DFS 也 使 用 颜色 来 记录 已 被 访问 的 顶点 。 未 访问 的 顶点 是 白色 的 , 已 被 访问 的 则 是 灰色 的 。 
如 果 一 个 顶点 的 所 有 相 邻 顶点 都 已 被 访问 过 ， 但 是 路 径 长 度 仍然 没有 达到 64， 就 说 明 遇 到 了 死 
路 。 如 果 遇 到 死路 ， 就 必须 回 湖 。 当 从 knightTour 返回 False 时 ， 就 会 发 生 回溯 。 在 宽度 优 
先 搜索 中 ,我 们 使 用 了 队列 来 记录 将 要 访问 的 项 点 。 由 于 深度 优先 搜索 是 递归 的 ， 因此 我 们 隐 式 
地 使 用 一 个 栈 来 回 湖 。 当 从 knightTour 调用 返回 False 时 , 仍然 在 while 循环 中 , 并 且 会 查 
看 nbrList 中 的 下 一 个 顶点 。 


代码 清单 7-8 ”knightTour 函数 











































































































1 from pythonds.graphs import Graph, Vertex 

2 def knightTour (n, path, u, limit): 

3 u.setColor('gray') 

4 path.appengd (u) 

3 TF i 

6 nbrList = list(u.getConnections()) 

这 1 0 

8 done = False 

9 while i < len(nbrList) and not done: 
10 if nbrList[i].getColor() == 'white': 
11 done = knightTour (n+1, 

于 多 path, 

13 HBrLIiSt [EE] 
14 limit) 

5 "i 

16 if not done: # 准备 回 济 

19 path.pop() 

18 u.setColor('white') 

下 号 else: 

20 done = True 

2 return done 
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让 我 们 通过 一 个 例子 来 看 看 knightTour 的 运行 情况 , 可 以 参照 图 7-12 来 追踪 搜索 的 变化 。 
这 个 例子 假设 在 代码 清单 7-8 中 第 6 行 对 getconnections 方法 的 调用 将 顶点 按照 字母 顺序 排 


好 。 首 先 调用 knigh 
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knightTour 函数 从 顶点 A 开始 访问 。 与 A 相 邻 的 顶点 是 B 和 D。 按 照 字母 顺序 ，B 在 D 
之 前 ， 因 此 DFS 选择 B 作为 下 一 个 要 访问 的 顶点 ， 如 图 7-12b 所 示 。 对 B 的 访问 从 递归 调用 
knightTour 开始 。B 与 C 和 DD 相 邻 ,因此 knightTour 接 下 来 会 访问 C。 但 是 , C 没 有 白色 的 
相 邻 顶点 ( 如 图 7-12c 所 示 )， 因 此 是 死路 。 此 时 ,将 C 的 颜色 改 回 白色 。knignhtTour 的 调用 
返回 False， 也 就 是 将 搜索 回溯 到 顶点 B， 如 图 7-12d 所 示 。 接 下 来 要 访问 的 顶点 是 D， 因 此 
knightTour 进行 了 一 次 递归 调 用 来 访问 它 。 从 顶点 D 开始 ， knightTour 可 以 继续 进行 递归 调 
用 ， 直 到 再 一 次 访问 顶点 C。 但 是 ， 这 一 次 ， 检 验 条 件 na < limit 失败 了 ， 因 此 我 们 知道 遍历 
完了 图 中 所 有 的 顶点 。 此 时 返回 True, 以 表明 对 图 进行 了 一 次 成 功 的 遍历 。 当 返回 列表 时 , path 





包含 [A,，B, D, EE， 
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F，C]。 其 中 的 顺序 就 是 每 个 顶点 只 访问 一 次 所 需 的 顺序 。 
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图 7-12 利用 knightTour 函数 找到 路 径 


图 7-13 展示 了 在 8x8 的 棋盘 上 周游 的 完整 路 径 。 存 在 多 条 周游 路 径 , 其 中 有 一 些 是 对 称 的 。 
通过 一 些 修改 之 后 ， 可 以 实现 循环 周游 ， 即 起 点 和 终点 在 同一 个 位 置 。 





7.5 深度 优先 搜索 “231 
























































图 7-13 周游 路 径 





7.5.4 分析 骑 士 周游 


在 学 习 深度 优先 搜索 的 通用 版 本 之 前 , 我 们 探索 骑士 周游 问题 中 的 最 后 一 个 有 趣 的 话题 : 性 
能 。 具体 地 说 ，knightTour 对 用 于 选择 下 一 个 访问 顶点 的 方法 非常 敏感 。 例 如 ， 利 用 速度 正常 
的 计算 机 ， 可 以 在 1.5 秒 之 内 针对 5x5 的 棋盘 生成 一 条 周游 路 径 。 但 是 ， 如 果 针 对 8x8 的 棋盘 ， 
会 怎么 样 呢 ? 可 能 需要 等 待 半 个 小 时 才能 得 到 结果 ! 

如 此 耗 时 的 原因 在 于 ， 目 前 实现 的 骑士 周游 问题 算法 是 一 种 OU ) 的 指数 阶 算法 ， 其 中 N 
是 棋盘 上 的 格子 数 , 是 一 个 较 小 的 常量 。 图 7-14 有 助 于 理解 搜索 过 程 。 树 的 根 节 点 代表 搜索 过 
程 的 起 点 。 从 起 点 开始 ,算法 生成 并 且 检 测 骑士 能 走 的 每 一 步 。 如 前 所 述 ,， 合理 走 法 的 数目 取决 
于 骑士 在 棋盘 上 的 位 置 。 若 骑士 位 于 四 角 ， 只 有 2 种 合理 走 法 ; 若 位 于 与 四 角 相 邻 的 格子 中 , 则 
有 3 种 合理 走 法 ; 若 在 棋盘 中 央 ， 则 有 8 种 合理 走 法 。 图 7-15 展示 了 棋盘 上 的 每 一 格 所 对 应 的 
合理 走 法 数目 。 在 树 的 下 一 层 ， 对 于 骑士 当前 位 置 来 说 ， 又 有 2~8 种 不 同 的 合理 走 法 。 待 检查 位 
置 的 数目 对 应 搜索 树 中 的 节点 数目 。 
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图 7-14 骑士 周游 问题 的 搜索 树 
































图 7-15 ”每 个 格子 对 应 的 合理 走 法 数目 











我 们 已 经 看 到 ， 在 高 度 为 N 的 二 又 树 中 ， 节 点 数 为 2”” -1; 至 于 子 节 点 可 能 多 达 8 个 而 非 2 
个 的 树 ， 其 节点 数 会 更 多 。 由 于 每 一 个 节点 的 分 支 数 是 可 变 的 ， 因 此 可 以 使 用 平均 分 支 因子 来 估 
计 节 点 数 。 需 要 注意 的 是 ， 这 个 算法 是 指数 阶 算法 : 各” -1， 其 中 大 是 棋盘 的 平均 分 支 因子 。 让 
我 们 看 看 它 增 长 得 有 多 快 。 对 于 5x5 的 棋盘 ,搜索 树 有 25 层 〈 若 把 顶层 记 为 第 0 层 , 则 N=24 )， 
平均 分 文 因子 k=3.8。 因 此 ， 搜 索 树 中 的 节点 数 是 3.8”-1 或 者 3.12x10* 。 对 于 6x6 的 棋盘 ，k= 
4.4， 搜 索 树 有 1.5x10” 个 节点 。 对 于 8x8 的 棋盘 ，k=5.25， 搜 索 树 有 1.3x10“ 个 节点 。 由 于 这 个 
问题 有 很 多 个 解 ， 因 此 不 需要 访问 搜索 树 中 的 每 一 个 节点 。 但 是 ， 需 要 访问 的 节点 的 小 数 部 分 只 
是 一 个 常量 乘 数 , 它 并 不 能 改变 该 问题 的 指数 特性 。 我们 把 将 表达 成 棋盘 大 小 的 函数 留 作 练 习 。 

幸运 的 是 ， 有 办 法 针对 8x8 的 棋盘 在 1 秒 内 得 到 一 条 周游 路 径 。 代 码 清单 7.9 展示 了 加 速 搜 
索 过 程 的 代码 。orderByAvail 函数 用 于 替换 代码 清单 7-8 中 第 6 行 的 u.getconnections 调 
用 。 在 orderByAvail 函数 中 ,第 10 行 是 最 重要 的 一 行 。 这 一 行 保证 接 下 来 要 访问 的 顶点 有 最 
少 的 合理 走 法 。 你 可 能 认为 这 样 做 非常 影响 性 能 ; 为 什么 不 选择 合理 走 法 最 多 的 顶点 呢 ? 运行 该 
程序 ， 并 在 排序 语句 之 后 插入 resList .reverse(), 便 可 轻松 找到 原因 。 
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代码 清单 7-9 选择 下 一 个 要 访问 的 顶点 至 关 重 要 


def orderByAvail (n): 
resList = [] 
for Vv in n.getConnections(): 
If v.getColor() == 'white': 
过 二 
for w in v.getConnections(): 
if w.getColor() == 'white': 
ECG 
resList.append((c, v)) 
resList.sort(key = lambda x: x[0]) 
return [y[1] for y in resList] 
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选择 合理 走 法 最 多 的 顶点 作为 下 一 个 访问 顶点 的 问题 在 于 , 它 会 使 骑士 在 周游 的 前 期 就 访问 
位 于 棋盘 中 间 的 格子 。 当 这 种 情况 发 生 时 ， 骑 士 很 容易 被 困 在 棋盘 的 一 边 ， 而 无 法 到 达 另 一 边 的 
那些 没 访问 过 的 格子 。 首 先 访问 合理 走 法 最 少 的 顶点 ， 则 可 使 骑士 优先 访问 棋盘 边缘 的 格子 。 这 
样 做 保证 了 骑士 能 够 尽早 访问 难以 到 达 的 角落 , 并 且 在 需要 的 时 候 通 过 中 间 的 格子 跨越 到 棋盘 的 
另 一 边 。 我 们 称 利 用 这 类 知识 来 加 速算 法 为 启发 式 技 术 。 人 类 每 天 都 在 使 用 启发 式 技术 做 决定 ， 
启发 式 搜 索 也 经 常 被 用 于 人 工 智能 领域 。 本 例 用 到 的 启发 式 技术 被 称 作 Warnsdorff 算法， 以 纪念 
在 1823 年 提出 该 算法 的 数学 家 H. C. Warnsdorff。 






































7.5.5 通用 深度 优先 搜索 

骑士 周游 是 深度 优先 搜索 的 一 种 特殊 情况 ,， 它 需要 创建 没有 分 支 的 最 深 深 度 优 先 搜索 树 。 通 
用 的 深度 优先 搜索 其 实 更 简单 , 它 的 目标 是 尽 可 能 深 地 搜索 ， 尽 可 能 多 地 连接 图 中 的 顶点 , 并 且 
在 需要 的 时 候 进 行 分 文 。 

一 次 深度 优先 搜索 甚至 能 够 创建 多 棵 深度 优先 搜索 树 , 我 们 称 之 为 深度 优先 森林 。 和 宽度 优 
先 搜索 类 似 , 深度 优先 搜索 也 利用 前 驱 连接 来 构建 树 。 此 外 ， 深 度 优先 搜索 还 会 使 用 Vertex 类 
中 的 两 个 额外 的 实例 变量 : 发 现时 间 记 录 算 法 在 第 一 次 访问 顶点 时 的 步 数 , 结束 时 间 记 录 算 法 在 
顶点 被 标记 为 黑色 时 的 步 数 。 在 学 习 之 后 会 发 现 , 顶点 的 发 现时 间 和 结束 时 间 提 供 了 一 些 有 趣 的 
特性 ， 后 续 算 法 会 用 到 这 些 特性 。 

深度 优先 搜索 的 实现 如 代码 清单 7-10 所 示 。 由 于 afs 函数 和 afsvisit 辅助 函数 使 用 一 个 
变量 来 记录 调用 afsvisit 的 时 间 ， 因 此 我 们 选择 将 代码 作为 Graph 类 的 一 个 子 类 中 的 方法 来 
实现 。 该 实现 继承 Graph 类 ， 并 且 增 加 了 time 实例 变量 ， 以 及 dfs 和 dfsvisit 两 个 方法 。 
注意 第 11 行 ，afs 方法 遍历 图 中 所 有 的 顶点， 并 对 白色 顶点 调用 afsvisit 方法 。 之 所 以 遍历 
所 有 的 顶点 , 而 不 是 简单 地 从 一 个 指定 的 项 点 开始 搜索 , 是 因为 这 样 做 能 够 确保 深度 优先 森林 中 
的 所 有 顶点 都 在 考虑 范围 内 ， 而 不 会 有 被 遗漏 的 顶点 。for avVertex in self 这 条 语句 可 能 看 
上 去 不 太 正 确 , 但 是 此 处 的 self 是 DFSGraph 类 的 一 个 实例 , 遍历 一 个 图 实例 中 的 所 有 顶点 其 
实 是 一 件 非常 自然 的 事情 。 
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代码 清单 7-10 ”实现 通用 深度 优先 搜索 








1 from pythonds.graphs import Graph 

2 class DFSGraph (Graph): 

3 def _ init_ _ (self) : 

4 super(). __ init _() 

5 self.time = 0 

6 

7 def dfs(self): 

8 for aVertex in self: 

9 aVertex.setColor('white') 

10 aVertex.setPred(-1) 

二 下 for aVertex in self: 

下 2 if aVertex.getColor() == 'white' : 
13 self.dfsvisit (aVertex) 

14 

15 def dfsvisit(self, startVertex): 

16 startVertex.setColor('gray') 

LY self.time += 1 

18 startVertex.setDiscovery (self.time) 

19 for nextVertex in startVertex.getConnections(): 
20 if nextVertex.getColor() == 'white': 
| nextVertex.setPpred(startVertex) 
22 self.dfsvisit (nextVertex) 

23 startVertex.setColor('black') 

24 self.time += 1 

25 startVertex.setFinish(self.time) 











尽管 本 例 中 的 pfs 实现 只 对 回 到 起 点 的 路 径 上 的 顶点 感 兴趣 ， 但 也 可 以 创建 一 个 表示 图 中 
所 有 顶点 间 的 最 短路 径 的 宽度 优先 森林 。 这 个 问题 留 作 练习 。 在 接 下 来 的 两 个 例子 中 ,我 们 会 看 
到 为 何 记录 深度 优先 穆 林 十 分 重要 。 

从 startVertex 开始 ，dafsvisit 方法 尽 可 能 深 地 探索 所 有 相 邻 的 白色 项 点。 如 果 仔 细 观 
察 afsvisit 的 代码 并 且 将 其 与 bfs 比较 ， 应 该 注意 到 二 者 几乎 一 样 ， 除 了 内 部 for 循环 的 最 
后 一 行 , afsvisit 通过 递归 地 调用 自己 来 继续 进行 下 一 层 的 搜索 , bfs 则 将 顶点 添加 到 队列 中 ， 
以 供 后 续 搜 索 。 有 趣 的 是 ，pfs 使 用 队列 ，afsvisit 则 使 用 栈 。 我 们 没有 在 代码 中 看 到 栈 ， 但 
是 它 其 实 隐 式 地 存在 于 afsvisit 的 递归 调用 中 。 

7-16 展示 了 在 小 型 图 上 应 用 深度 优先 搜索 算法 的 过 程 。 图 中 ， 虚 线 表示 被 检查 过 的 边 ， 
但 是 其 一 端的 顶点 已 经 被 添加 到 深度 优先 搜索 树 中 。 在 代码 中 , 这 是 通过 检查 另 一 端的 顶点 是 否 
不 为 白色 来 完成 的 。 
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图 7-16 构建 深度 优先 搜索 树 














搜索 从 图 中 的 项 点 A 开始。 由 于 所 有 项 点 一 开始 都 是 白色 的 ,因此 算法 会 访问 A。 访问 顶点 
的 第 一 步 是 将 其 颜色 设置 为 灰色 ， 以 表明 正在 访问 该 顶点 ， 并 将 其 发 现时 间 设 为 1。 由 于 A 有 两 

















个 相 邻 顶点 (B 和 D )， 因 此 它们 都 需要 被 访问 。 我 们 按照 字母 顺序 来 访问 顶点 。 
接 下 来 访问 顶点 B， 将 它 的 颜色 设置 为 灰色 ， 并 把 发 现时 间 设 置 为 2。B 也 与 两 个 顶点 (C 








和 D ) 相 邻 ， 因 此 根据 字母 顺序 访问 C。 
访问 C 时 ， 搜 索 到 达 某 个 分 支 的 终点 。 在 将 C 标 为 灰色 并 





且 把 发 现时 间 设 置 为 3 之 后 ， 算 





法 发 现 C 没有 相 邻 顶点 。 这 意味 着 对 C 的 探索 完成 , 因此 将 它 标 为 黑色 , 并 将 完成 时 间 设 置 为 4。 


图 7-16d 展示 了 搜索 至 这 一 步 时 的 状态 。 





由 于 C 是 一 个 分 支 的 终点 ,因此 需要 返回 到 B, 并 且 继 续 探 索 其 余 的 相 邻 顶点 。 唯 一 的 待 探 
索 顶 点 就 是 D， 它 把 搜索 引 到 E。E 有 两 个 相 邻 顶点 ， 即 B 和 上 。 正 常情 况 下 ， 应 该 按照 字母 顺 
序 来 访问 这 两 个 顶点 , 但 是 由 于 B 已 经 被 标记 为 灰色 ， 因 此 算法 自 知 不 应 该 访问 B， 因 为 如 果 这 
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么 做 就 会 陷入 死 循环 。 因 此 ， 探 索 过 程 跳 过 B， 继 续 访 问 F。 

F 只 有 C 这 一 个 相 邻 顶点 , 但 是 C 已 经 被 标记 为 黑色 ,因此 没有 后 续 顶 点 需要 探索 ,也 即 到 
达 另 一 个 分 支 的 终点 。 从 此 时 起 ,算法 一 路 回溯 到 起 点 ， 同 时 为 各 个 顶点 设置 完成 时 间 并 将 它们 
标记 为 黑色 ， 如 图 7-16h~ 图 7-161 所 示 。 


每 个 顶点 的 发 现时 间 和 结束 时 间 都 体现 了 括号 特性 , 这 意味 着 深度 优先 搜索 树 中 的 任 一 节点 
的 子 节 点 都 有 比 该 节点 更 晚 的 发 现时 间 和 更 早 的 结束 时 间 。 图 7-17 展示 了 通过 深度 优先 搜索 算 


法 构建 的 树 。 
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图 7-17 最 终 的 深度 优先 搜索 树 


7.5.6 “分析 深度 优先 搜索 


一 般 来 说 ,深度 优先 搜索 的 运行 时 间 如 下 。 在 代码 清单 7-10 中 ,， 若 不 计 afsvisit 的 运行 
时 间 , 第 8 行 和 第 11 行 的 循环 为 O(V) ， 这 是 由 于 它们 针对 图 中 的 每 个 项 点 都 只 执行 一 次 。 在 
dfsvisit 中 , 第 19 行 的 循环 针对 当前 顶点 的 邻接 表 中 的 每 一 条 边 都 执行 一 次 。 由 于 afsvisit 
只 有 在 顶点 是 白色 时 被 递归 调用 ， 因 此 循环 最 多 会 对 图 中 的 每 一 条 边 执 行 一 次 ， 也 就 是 O(E) 。 
因此 ， 深 度 优先 搜索 算法 的 时 间 复 杂 度 是 O(V + EB) 。 


7.6 ”拓扑 排序 


为 了 展示 计算 机 科学 家 可 以 将 几乎 所 有 问题 都 转换 成 图 问题 , 让 我 们 来 考虑 如 何 制 作 一 批 松 
饼 。 配 方 十 分 简单 : 一 个 鸡蛋 、 一 杯 松 饼 粉 、 一 勺 油 ， 以 及 3/4 杯 牛奶 。 为 了 制作 松 饼 ,需要 加 
热 平 底 锅 ,并 将 所 有 原材料 混合 后 倒 入 锅 中 。 当 出 现 气泡 时 ,将 松 饼 翻 面 ， 继 续 前 至 底部 变 成 金 
黄色 。 在 享用 松 饼 之 前 ， 还 会 加 热 一 些 枫 糖浆。 图 7-18 用 图 的 形式 展示 了 整个 过 程 。 
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图 7-18 ” 松 饼 的 制作 步骤 











制作 松 饼 的 难点 在 于 知道 先 做 哪 一 步 。 从 图 7-18 可 知 ， 可 以 首先 加 热 平 底 锅 或 者 混合 原 材 
料 。 我 们 借助 拓扑 排序 这 种 图 算法 来 确定 制作 松 饼 的 步骤 。 


拓扑 排序 根据 有 向 无 环 图 生成 一 个 包含 所 有 顶点 的 线性 序列 ， 使 得 如 果 图 G 中 有 一 条 边 为 
(v,w) ， 那 么 顶点 v 排 在 顶点 w 之 前 。 在 很 多 应 用 中 ， 有 癌 无 环 图 被 用 于 表明 事件 优先 级 。 制 作 
松 饼 只 是 其 中 一 个 例子 , 其 他 例子 还 包括 软件 项 目 调度 、 优 化 数据 库 查 询 的 优先 级 表 ， 以 及 矩阵 
相 乘 。 

拓扑 排序 是 对 深度 优先 搜索 的 一 种 简单 而 强大 的 改进 ， 其 算法 如 下 。 


(1) 对 图 g 调用 dfs (g) 。 之 所 以 调用 深度 优先 搜索 函数 ， 是 因为 要 计算 每 一 个 顶点 的 结束 
时 间 。 


(2) 基于 结束 时 间 ， 将 顶点 按照 递减 顺序 存储 在 列表 中 。 
(3) 将 有 序列 表 作为 拓扑 排序 的 结果 返回 。 
7-19 展示 了 afs 根据 如 图 7-18 所 示 的 松 饼 制 作 步 又 构建 的 深度 优先 森林 。 
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图 7-19 根据 松 饼 制作 步骤 构建 的 深度 优先 森林 
图 7-20 展示 了 拓扑 排序 结果 。 现 在 ， 我 们 明确 地 知道 了 制作 松 饼 所 需 的 步骤 。 
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图 7-20 对 有 向 无 环 图 的 拓扑 排序 结果 





7.7” 强 连通 单元 


接 下 来 将 注意 力 转向 规模 庞大 的 图 。 我 们 将 以 互联 网 主机 与 各 个 网 页 构成 的 图 为 例 , 学 习 ] 





他 儿 种 算法 。 首 先 讨论 网 页 。 


开始 享用 
5/6 








证 





在 互联 网 上 ,各 种 网 页 形成 一 张大 型 的 有 向 图 ,谷歌 和 必 应 等 搜索 引擎 正 是 利用 了 这 一 事实 。 
要 将 互联 网 转换 成 一 张 图 ， 我 们 将 网 页 当 作 项 点， 将 超 链 接 当 作 连 接 顶 点 的 边 。 图 7-21 展示 了 














以 路 德 学 院 计算 机 系 的 主页 作为 起 点 的 网 页 连接 图 的 一 小 部 分 。 由 于 这 张 图 的 规模 庞大 ,因此 我 














们 限制 网 页 与 起 点 页 之 间 的 链接 数 不 超 过 10 个 。 

















站 。 其 次 , 一 些 链接 指向 爱 丛 华 州 的 其 他 学 校 。 最 后 ,一些 链接 指向 其 他 文理 学 院 。 
出 这 样 的 结论 : 网 络 具 有 一 种 基础 结构 ， 使 得 在 茶 种 程度 上 相似 的 网 页 相互 聚集 。 












































子 细 人 研究 图 7-21, 会 有 一 些 非常 有 趣 的 发 现 。 首 先 , 图 中 的 很 多 网 页 来 自 路 德 学 院 的 其 他 网 


此 可 以 得 
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图 7-21 以 路 德 学 院 计算 机 系 的 主页 作为 起 点 的 网 页 连接 图 


通过 一 种 叫 作 强 连通 单元 的 图 算法 ,可 以 找 出 图 中 高 度 连通 的 顶点 复 。 对 于 图 G， 强 连通 单 
元 C 为 最 大 的 顶点 子 集 CCcF ， 其 中 对 于 每 一 对 顶点 wweC ， 都 有 一 条 从 v 到 wm 的 路 径 和 一 条 
从 w 到 vv 的 路径。 


图 7-22 展示 了 一 个 包含 3 个 强 连通 单元 的 简单 图 ,不 同 的 强 连通 单元 通过 不 同 的 阴影 来 表现 。 























图 7-22 含有 3 个 强 连通 单元 的 有 向 图 
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图 简化 。 



































定义 强 连通 单元 之 后 ， 就 可 以 把 强 连通 单元 中 的 所 有 顶点 组 合成 单个 顶点 ， 从 而 将 


图 7-23 是 图 7-22 的 简化 版 。 
> 


图 7-23 简化 后 的 有 向 图 

利用 深度 优先 搜索 , 我 们 可 以 再 次 创建 强大 高 效 的 算法 。 在 学 习 强 连通 单元 算法 之 前 , 还 要 
再 看 一 个 定义 。 图 G 的 转 置 图 被 定义 为 G”， 其 中 所 有 的 边 都 与 图 G 的 边 反 向 。 这 意味 着 ， 如 果 
在 图 G 中 有 一 条 由 A 到 B 的 边 ， 那 么 在 G7” 中 就 会 有 一 条 由 B 到 A 的 边 。 图 7-24 展示 了 一 个 简 


单 图 及 其 转 置 图 。 


we 
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(b) 图 G 的 转 置 














(a) 图 G 














图 7-24 图 G 及 其 转 置 图 




















再 次 观察 图 7-24。 注 意 ， 图 7-24a 中 有 2 个 强 连 通 单元 ， 图 7-24b 中 也 是 如 此 。 




















以 下 是 计算 强 连通 单元 的 算法 。 
(1) 对 图 G 调用 afs， 以 计算 每 一 个 顶点 的 结束 时 间 。 


(2) 计算 图 G7 。 
(3) 对 图 G7” 调用 afts， 但 是 在 主 循环 中 ， 按 照 结 束 时 间 的 递减 顺序 访问 顶点 。 


(4) 第 3 步 得 到 的 深度 优先 森林 中 的 每 一 棵 树 都 是 一 个 强 连通 单元 。 输 出 每 一 棵 树 中 的 顶点 
的 id。 
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以 图 7-22 为 例 , 让 我 们 来 逐步 分 析 。 图 7-25a 展示 了 用 深度 优先 搜索 算法 对 原 图 计算 得 到 的 发 
现时 间 和 结束 时 间 ， 图 7-25b 展示 了 用 深度 优先 搜索 算法 在 转 置 图 上 得 到 的 发 现时 间 和 结束 时 间 。 














(a) 图 G (b) 图 G 的 转 置 图 
图 7-25 ”计算 强 连 通 单元 


最 后 ， 图 7-26 展示 了 由 强 连通 单元 算法 在 第 3 步 生成 的 森林 ， 其 中 有 3 棵 树 。 我 们 没有 提 



































供 强 连通 单元 算法 的 Python 代码 ， 而 是 将 其 作为 编程 练习 。 
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图 7-26 由 强 连通 单元 算法 生成 的 森林 


7.8 最 短路 径 问题 


当 我 们 浏览 网 页 、 发 送 电子 邮件 ,或 者 从 校园 的 另 一 处 登录 实验 室 里 的 计算 机 时 , 在 后 台 发 
生 了 很 多 事 , 信息 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 深入 地 研究 信息 在 多 台 计 算 机 之 间 的 传送 
过 程 , 是 计算 机 网 络 课程 的 主要 内 容 。 本 闻 将 适当 地 讨论 互联 网 的 运作 机 制 ， 并 以 此 介绍 男 一 个 


非常 重要 的 图 算法 。 






































图 7-27 互联 网 通信 概览 











7-27 从 整体 上 展示 了 互联 网 的 通信 机 制 。 当 我 们 使 用 浏览 器 访问 某 一 台 服 务 器 上 的 网 页 
时 , 访问 请 求 必 须 通 过 路 由 器 从 本 地 局 域 网 传送 到 互联 网 上 , 并 最 终 到 达 该 服务 器 所 在 局 域 网 对 
应 的 路 由 器 。 然 后 ， 被 请 求 的 网 页 通过 相同 的 路 径 被 传送 回 浏 览 器 。 在 图 7-27 中 , 标 有 “互联 
网 ”的 云图 标 中 有 众多 额外 的 路 由 器 ,它们 的 工作 就 是 协同 将 信息 从 一 处 传送 到 另 一 人 处。 如果 你 
的 计算 机 支持 traceroute 命令 ,可 以 利用 它 亲 眼看 到 许多 路 由 器 。 图 7-28 展示 了 traceroute 
命令 的 执行 结果 : 在 路 德 学 院 的 Web 服务 器 和 明尼苏达 大 学 的 邮件 服务 器 之 间 有 13 个 路 由 器 。 



































1 192.203.196:1 

号 hilda.luther.edu(216.159.75.1) 

3 ICN-Luther-Ether.icn,.state.ia.us(207.165.237.137) 

4 LEON: LOPS Lele tate. Tae (2 02500) 

5 p3-0.hsal.chil.bbnplanet .net (4.24.202.13) 

6 ae-1-54.bbr2.Chicagol.Level3.net (4.68.101.97) 

7 So-3-0-0.mpls2.Minneapolisl.Level3.net (64.159.4.214) 
8 ge-3-0.hsa2.Minneapolisl.Level3.net (4.68.112.18) 

> pl-0.minnesota.bbnplanet.net (4.24.226.74) 
10 TelecomB-BR-01-V4002.ggnet .umn.edu(192.42.152.37) 
NR TelecomB-BN-01-Vlan-3000.ggnet .umn.edu(128.101.58.1) 
12 TelecomB-CN-01-Vlan-710.ggnet .umn.edu(128.101.80.158) 
13 baldrick.cs.umn.edu{(128.101.80.129) (N!)88.631ms (N!) 





图 7-28 服务 器 之 间 的 路 由 器 


互联 网 上 的 每 一 个 路 由 器 都 与 一 个 或 多 个 其 他 的 路 由 器 相连 。 如 果 在 不 同 的 时 间 执 行 
traceroute 命令 , 极 有 可 能 看 到 信息 在 不 同 的 路 由 器 间 流动 。 这 是 由 于 一 对 路 由 器 之 间 的 连接 
存在 着 一 定 的 成 本 , 成 本 大 小 取决 于 流量 、 时 间 段 以 及 众多 其 他 因素 。 至 此 ,你 应 该 能 够 理解 为 
何 可 以 用 带 权 重 的 图 来 表示 路 由 需 网 络 。 

7-29 展示 了 一 个 小 型 路 由 器 网 络 对 应 的 带 权 图 。 我 们 要 解决 的 问题 是 为 给 定 信 息 找到 权 
重 最 小 的 路 径 。 这 个 问题 并 不 陌生 ， 因 为 它 和 我 们 之 前 用 宽度 优先 搜索 解决 过 的 问题 十 分 相似 ， 
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只 不 过 现在 考 
那么 两 个 问题 














虑 的 是 路 径 的 总 权重 , 而 不 是 路 径 的 长 度 。 需要 注意 的 是 , 如 果 所 有 的 权重 都 相等 ， 


就 没有 区 别 。 


图 7-29 ”小 型 路 由 器 网 络 对 应 的 带 权 图 








7.8.1 Dijkstra 算 ; 
Dijkstra 算法 可 用 于 确定 最 短路 径 ， 它 是 一 种 循环 算法 ， 可 以 提供 从 一 个 顶点 到 其 他 所 有 项 


点 的 最 短路 径 








。 这 与 宽度 优先 搜索 非常 像 。 


为 了 记录 从 起 点 到 各 个 终点 的 总 开销 ， 要 利用 Vertex 类 中 的 实例 变量 aist。 该 实例 变量 
记录 从 起 点 到 当前 顶点 的 最 小 权重 路 径 的 总 权重 。 Dijkstra 算法 针对 图 中 的 每 个 顶点 都 循环 一 次 ， 

















但 循环 顺序 是 























由 一 个 优先 级 队列 控制 的 。 用 来 决定 顺序 的 正 是 aist。 在 创建 项 点 时 , 将 aist 








设 为 一 个 非常 大 的 值 。 理论 上 可 以 将 aist 设 为 无 穷 大 , 但 是 实际 一 般 将 其 设 为 一 个 大 于 所 有 可 
能 出 现 的 实际 距离 的 值 。 


Dijkstra 算法 的 实现 如 代码 清单 7-11 所 示 。 当 程序 运行 结束 时 , dist 和 predecessor 都 会 
被 设置 成 正确 的 值 。 


代码 清单 7-11 ” Dijkstra 算法 的 Python 实现 











pq = 


from pythonds.graphs import PriorityQueue, Graph, Vertex 
def dijkstra(laGraph, start): 


PriorityQueue() 


start.setDistance(0) 

pq.buildHeap([(v.getDistance(), v) for Vv in aGraph]) 
while not pq.isEmpty(): 

currentVert = pq.delMin() 





\D oOwm 心 wwN 情 


for nextVert in currentVert.getConnections(): 
newDist = currentVert.getDistance() \ 








10 + CurrentVert .getWeight (nextVert) 
I if newDist < nextVert.getDistance(): 

12 nextVert .setDistance (newDist) 

13 nextVert.setPred(currentVert) 

14 pq.decreaseKey (nextVert, newDist) 




















Dijkstra 算 法 使 用 了 优先 级 队列 。 你 应 该 记得 , 第 6 章 讲 过 如 何 用 堆 实 现 优先 级 队列 。 不 过 ， 
第 6 章 中 的 简单 实现 和 用 于 Dijkstra 算法 的 实现 有 几 个 不 同 点 。 首先 ，PriorityQueue 类 存储 
了 键 - 值 对 的 二 元 组 。 这 对 于 Dijkstra 算法 来 说 非常 重要 ， 因 为 优先 级 队列 中 的 键 必须 与 图 中 顶 
点 的 键 相 匹配 。 其 次 ,二 元 组 中 的 值 被 用 来 确定 优先 级 ,对 应 键 在 优先 级 队列 中 的 位 置 ,在 Dijkstra 
算法 的 实现 中 ， 我 们 使 用 了 顶点 的 距离 作为 优先 级 ， 这 是 因为 我 们 总 希望 访问 距离 最 小 的 顶点 。 
男 一 个 不 同 点 是 增加 了 decreaseKey 方法 (第 14 行 )。 当 到 一 个 顶点 的 距离 减少 并 且 该 项 点 已 
在 优先 级 队列 中 时 ， 就 调用 这 个 方法 ， 从 而 将 该 顶点 移 向 优先 级 队列 的 头 部 。 

证 我 们 对 照 图 7-30 来 理解 如 何 针对 每 一 个 顶点 应 用 Dijkstra 算法 。 从 项 点 u 开始 ， 与 u 相 邻 
的 3 个 顶点 分 别 是 v、w 和 x。 由 于 到 v、w 和 x 的 初始 距离 都 是 sys .maxint， 因 此 从 起 点 到 它们 
的 新 开销 就 是 直接 开销 。 更 新 这 3 个 顶点 的 开销 ， 同 时 将 它们 的 前 驱 顶 点 设置 成 xu， 并 将 它们 添 
加 到 优先 级 队列 中 。 我 们 使 用 距离 作为 优先 级 队列 的 键 。 此 时 ,算法 运行 的 状态 如 图 7-30a 所 示 。 


























(a) (b) 《9) 


人 CY « 《Yo 


(d) (e) OD 
图 7-30 Dijkstra 算法 的 应 用 过 程 


下 一 次 while 循环 检查 与 x 相 邻 的 顶点 。 之 所 以 x 是 第 2 个 被 访问 的 顶点, 是 因为 它 到 起 点 
的 开销 最 小 ， 因 此 排 在 了 优先 级 队列 的 头 部 。 与 x 相 邻 的 有 wu、v、w 和 y。 对 于 每 一 个 相 邻 顶点 ， 
检查 经 由 x 到 它 的 距离 是 否 比 已 知 的 距离 更 短 。 显 然 ， 对 于 y 来 说 确实 如 此 ， 因 为 它 的 初始 距离 
是 sys .maxint; 对 于 wu 和 vv 来 说 则 不 然 ， 因为 它们 的 距离 分 别 为 0 和 2。 但是， 我 们 发 现 经 过 
x 到 w 的 距离 比 直接 从 w 到 w 的 距离 要 短 。 因 此 , 将 到 达 w 的 距离 更 新 为 更 短 的 值 , 并 且 将 w 的 
前 驱 顶 点 从 xz 改 为 x。 图 7-30b 展示 了 此 时 的 状态 。 
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下 一 步 检查 与 v 相 邻 的 项 点。 这 一 步 没 有 对 图 做 任何 改动 , 因此 我 们 继续 检查 顶点 y。 此 时 ， 
我 们 发 现 经 由 yy 到 达 w 和 z 的 距离 都 更 短 ， 因 此 相应 地 调整 它们 的 距离 及 前 驱 顶 点 。 最 后 检查 w 
和 z， 发 现 不 需要 做 任何 改动 。 由 于 优先 级 队列 为 空 ， 因 此 退出 。 

非常 重要 的 一 点 是 ，Dijkstra 算法 只 适用 于 边 的 权重 均 为 正 的 情况 。 如 果 图 7-29 中 有 一 条 边 
的 权重 为 负 ， 那 么 Dijkstra 算法 永远 不 会 退出 。 

除了 Dijkstra 算法 , 还 有 其 他 一 些 算法 被 用 于 寻找 最 短路 径 。 Dijkstra 算法 的 问题 是 需要 有 完 
整 的 图 ， 这 意味 着 每 一 个 路 由 器 都 要 知道 整个 互联 网 的 路 由 器 连接 情况 ， 而 事实 并 非 如 此 。 
Dijkstra 算法 的 一 些 变 体 允 许 每 个 路 由 器 在 运行 时 才 发 现 图 ， 例 如 “距离 向 量 ” 路 由 算法 。 





















































7.8.2 分析 Dijkstra 算法 


最 后 ， 我 们 来 分 析 Dijkstra 算法 的 时 间 复 杂 度 。 开 始 时 ， 要 将 图 中 的 每 一 个 顶点 都 添加 到 优 
先 级 队列 中 ， 这 个 操作 的 时 间 复 杂 度 是 O(7) 。 优 先 级 队列 构建 完成 之 后 ，while 循环 针对 每 一 
个 顶点 都 执行 一 次 , 这 是 由 于 一 开始 所 有 顶点 都 被 添加 到 优先 级 队列 中 , 并 且 只 在 循环 时 才 被 移 
除 。 在 循环 内 部 ， 每 次 对 aelMin 的 调用 都 是 Odog 所 。 综 合 起 来 考虑 ,循环 和 aelMin 调用 的 
总 时 间 复 杂 度 是 O(V logV) 。for 循环 对 图 中 的 每 一 条 边 都 执行 一 次 ， 并 且 循 环 内 部 的 
decreaseKey 调用 为 O(ElogV) 。 因 此 ， 总 的 时 间 复 杂 度 为 O((V +E)log7) 。 
































7.8.3 ”Prim 算法 


在 学 习 最 后 一 个 图 算法 之 前 ， 先 考虑 网 络 游戏 设计 师 和 互联 网 广播 服务 提供 商 面 临 的 问题 。 
他 们 希望 高 效 地 把 信息 传递 给 所 有 人 。 这 在 网 络 游戏 中 非常 重要 , 因为 所 有 玩家 都 可 以 据 此 知道 








其 他 玩家 的 最 近 位 置 。 互 联网 广播 也 需要 做 到 这 一 点 , 以 让 所 有 听众 都 接收 到 所 需 数据 。 图 7-31 
展示 了 上 述 广播 问题 。 


互联 网 广播 服务 提供 商 


图 7-31 广播 问题 
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为 了 更 好 地 理解 上 述 问 题 , 我 们 先 来 看 看 如 何 通 过 蛮 力 法 求解 。 你 稍 后 会 看 到 ， 本 节 提 出 的 
解决 方案 为 何 优 于 蛮 力 法 。 假设 互联 网 广播 服务 提供 商 要 向 所 有 收听 者 播放 一 条 消息 , 最 简单 的 
方法 是 保存 一 份 包含 所 有 收听 者 的 列表 ， 然 后 向 每 一 个 收听 者 单独 发 送 消息 。 以 图 7-31 为 例 ， 
吾 采 用 上 述 解法 ， 则 每 一 条 消息 都 需要 有 4 份 副本 。 假设 使 用 开销 最 小 的 路 径 , 让 我 们 来 看 看 每 
一 个 路 由 需 需 要 处 理 多 少 次 相同 的 消息 。 

从 广播 服务 提供 商 发 出 的 所 有 消息 都 会 经 过 路 由 器 A, 因 此 和 A 能 够 看 到 每 一 条 消息 的 所 有 副 
本 。 路 由 器 C 只 能 看 到 一 份 副本 ， 而 由 于 路 由 器 B 和 DD 在 收听 者 1、2、3 的 最 短路 径 上 ， 因 此 
它们 能 够 看 到 每 一 条 消息 的 3 份 副本 。 考 虑 到 广播 服务 提供 商 每 秒 会 发 送 数 百 条 消息 , 这 样 做 会 
导致 流量 剧 增 。 

一 种 蛮 力 法 是 广播 服务 提供 商 针对 每 条 消息 只 发 送 一 份 副本 ， 然 后 由 路 由 器 来 正确 地 发 送 。 
最 简单 的 方法 就 是 无 控制 泛滥 法 , 策略 如 下 : 每 一 条 消息 都 设 有 存活 时 间 tt1, 它 大 于 或 等 于 广 
播 服务 提供 商 和 最 远 的 收听 者 之 间 的 距离 ; 每 一 个 路 由 器 都 接收 到 消息 的 一 份 副本 , 并 且 将 消息 
发 送 给 所 有 的 相 邻 路 由 器 。 在 消息 被 发 送 时 ， 它 的 ttl 递减 , 直到 变 为 0。 不 难 发 现 ， 无 控制 泛 
滥 法 产生 的 不 必要 消息 比 第 一 种 方法 更 多 。 

解决 广播 问题 的 关键 在 于 构建 一 棵 权重 最 小 的 生成 树 。 我 们 对 最 小 生成 树 的 正式 定义 如 下 : 
对 于 图 G=(V,E) ， 最 小 生成 树 7 是 的 无 环 子 集 ， 并 且 连 接 广 中 的 所 有 顶点 。 

图 7-32 展示 了 简化 的 广播 图 ， 并 且 突 出 显示 了 形成 最 小 生成 树 的 所 有 边 。 为 了 解决 广播 问 
题 , 广播 服务 提供 商 只 需 向 网 络 中 发 送 一 条 消息 副本 。 每 一 个 路 由 需 向 属于 生成 树 的 相 邻 路 由 器 
转发 消息 ， 其 中 不 包括 刚刚 向 它 发 送 消息 的 路 由 器 。 在 图 7-32 的 例子 中 ，A 把 消息 转发 给 B，B 
把 消息 转发 给 C 和 D，D 转发 给 EE，E 转发 给 F, FF 转发 给 G。 每 一 个 路 由 器 都 只 看 到 任意 消息 
的 一 份 副 本 ， 并 且 所 有 的 收听 者 都 接收 到 了 消息 。 






































































































































图 7-32 广播 图 中 的 最 小 生成 树 
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上 述 思路 对 应 的 算法 叫 作 Prim 算法 。 由 于 每 一 步 都 选择 代价 最 小 的 下 一 步 ， 因 此 Prim 算法 
属于 一 种 “ 贪 焚 算 法 "。 在 这 个 问题 中 , 代价 最 小 的 下 一 步 是 选择 权重 最 小 的 边 。 接 下 来 实现 Prim 
算法 。 

构建 生成 树 的 基本 思想 如 下 : 

当 7 还 不 是 生成 树 时 ，(a) 找到 一 条 可 以 安全 添加 到 树 中 的 边 ; (b) 将 新 的 边 添加 到 7 中。 


























难点 在 于 ， 如 何 找 到 “可 以 安全 添加 到 树 中 的 边 ”。 我 们 这 样 定 义 安全 的 边 : 它 的 一 端 是 生 
成 树 中 的 顶点 ， 男 一 端 是 还 不 在 生成 树 中 的 顶点 。 这 保证 了 构建 的 树 不 会 出 现 循 环 。 





Prim 算法 的 Python 实现 如 代码 清单 7-12 所 示 。 与 Dijkstra 算法 类 似 ，Prim 算法 也 使 用 了 优 
先 级 队列 来 选择 下 一 个 添加 到 图 中 的 顶点 。 


代码 清单 7-12 ”Prim 算 法 的 Python 实现 





1 from pythonds.graphs import PriorityQueue, Graph, Vertex 
2 def prim(G, start): 
3 pq = PriorityQueue () 
4 for V in G: 
5 Vv.setDistance(sys.maxsize) 
6 Vv.setPred (None) 
7 start.setDistance(0) 
8 pq.buildHeap([(v.getDistance(), v) for v in G]) 
9 while not pq.isEmpty(): 
currentVert = pq.delMin() 
for nextVert :in currentVert.getConnections(): 
newCost = currentVert .getWeight (nextVert) \ 
+ CurrentVert.getDistance() 
if Vv in pq and newCost < nextVert.getDistance(): 
nextVert .setpred (currentVert) 
nextVert .setDistance (newCost) 
pq.decreaseKey (nextVert, newCost) 


AO HA 








7-33 展示 了 将 Prim 算 法 应 用 于 示例 生成 树 的 过 程 。 以 顶点 A 作为 起 点 , 将 A 到 其 他 所 有 


际 的 距离 小 于 无 穷 大 。 更 新 距离 之 后 ，B 和 C 被 移 到 优先 级 队列 的 头 部 。 并且， 它们 的 前 驱 顶 点 
被 设置 为 A。 注 意 ， 我 们 还 没有 把 B 和 C 添加 到 生成 树 中 。 只 有 在 从 优先 级 队列 中 移 除 时 ， 顶 
点 才 会 被 添加 到 生成 树 中 。 






































A 
a ga 改观 
4 A : : 1 ee ) ， 2 
PQ =B.C.D.EF.G PQ =CD.EFG PQ =DEFG 
(a) (b) (9 
PQ =E.FG PQ =F.G PQ =G 
(d) (9) (D 
四 3 
感 -全 
”、 -和 
对 一 全- 
PQ= None 
(g) 
图 7-33 ”Prim 算 法 的 应 用 过 程 
由 于 到 B 的 距离 最 短 ， 因 此 接 下 来 检查 B 的 相 邻 项 点。 检查 后 发 现 ， 可 以 更 新 D 和 EE。 接 
下 来 处 理 优先 级 队列 中 的 下 一 个 顶点 C。 与 C 相 邻 的 唯一 一 个 还 在 优先 级 队列 中 的 顶点 是 下， 
此 更 新 到 下 的 距离 ， 并 且 调整 下 在 优先 级 队列 中 的 位 置 。 
现在 检查 与 D 相 邻 的 顶点 , 发 现 可 以 将 到 EE 的 距离 从 6 减少 为 4,。 修改 距离 的 同时 , 把 EE 的 

前 驱 顶 点 改 为 D， 以 此 准备 将 E 添加 到 生成 树 中 的 另 一 个 位 置 。Prim 算法 正 是 通过 这 样 的 方式 
将 每 一 个 顶点 都 添加 到 生成 树 中 。 
7.9 小 结 


本 章 介 绍 了 图 的 抽象 数据 类 型 ， 
就 可 以 利用 图 算法 加 以 解决 。 对 于 解决 下 列 问题 ， 图 非常 有 用 。 
口 利用 宽度 优先 搜索 找到 无 权重 的 最 短路 径 。 


以 及 一 些 实现 方式 。 如 果 能 将 一 个 问题 用 图 表示 出 来 , 那么 
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口 利用 Dijkstra 算法 求解 带 权重 的 最 短路 径 。 
口 利用 深度 优先 搜索 来 探索 图 。 

口 利用 强 连通 单元 来 简化 图 。 

口 利用 拓扑 排序 为 任务 排序 。 

口 利用 最 小 生成 树 广 播 消息 。 


7.10 ”关键 术语 














边 代价 顶点 环 

宽度 优先 搜索 ( BFS ) 括号 特性 邻接 表 邻接 矩阵 

路 径 强 连通 单元 权重 深度 优先 森林 
深度 优先 搜索 ( DFS ) 生成 树 拓扑 排序 无 环 图 

无 控制 泛滥 法 相 邻 有 环 图 有 向 图 

有 向 无 环 图 ( DAG ) 最 短路 径 





7.11 讨论 题 
1. 画 出 以 下 邻接 矩阵 对 应 的 图 。 























起 B C D E F 
态 7 5 1 
B 2 7 3 
C 2 8 
D 1 2 4 
E 6 5 
F 1 8 





























2. 画 出 符合 以 下 条 件 的 图 。 








起 点 终点 代价 
1 2 10 
1 3 15 
1 6 5 
2 3 7 
3 4 7 
3 6 10 
4 5 7 
6 4 5 
5 6 13 
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3. 忽略 权重 ， 针 对 讨论 题 1 中 的 图 进行 宽度 优先 搜索 。 

4. 在 代码 清单 7-3 中 ，buildGcraph 函数 的 时 间 复 杂 度 是 多 少 ? 

5. 推导 出 拓扑 排序 算法 的 时 间 复 杂 度 。 

6. 推导 出 强 连 通 单元 算法 的 时 间 复 杂 度 。 

7. 将 Dijkstra 算 法 应 用 于 讨论 题 2 中 的 图 ， 展 示 每 一 步 。 

8. 利用 Prim 算法 为 讨论 题 1 中 的 图 找到 最 小 生成 树 。 

9. 画 出 发 送 电子 邮件 所 需 步 又 的 依赖 图 ， 并 应 用 拓扑 排序 算法 。 

10， 推 导出 骑士 周游 问题 算法 的 时 间 复 杂 度 中 底数 的 表达 式 。 

11. 解释 通用 深度 优先 搜索 不 适用 于 骑士 周游 问题 的 原因 。 

12， 推 导出 Prim 算法 的 时 间 复 杂 度 。 

7.12 ”编程 练习 

1. 修改 深度 优先 搜索 函数 ， 以 进行 拓扑 排序 。 

2. 修改 深度 优先 搜索 函数 ， 以 计算 强 连通 单元 。 

3. 为 Graph 类 编写 transpose 方法 。 

4. 使 用 宽度 优先 搜索 实现 一 个 算法 ， 用 以 计算 从 每 一 个 顶点 到 其 余 所 有 顶点 的 最 短路 径 。 
这 被 称 为 所 有 对 最 短路 径 。 

5.， 使 用 宽度 优先 搜索 修改 第 4 章 中 的 迷宫 程序 ， 从 而 找到 走出 迷宫 的 最 短路 径 。 

6. 写 一 个 程序 来 解决 这 样 一 个 问题 有 2 个 坛子 ， 其 中 一 个 的 容量 是 4 加 仓 ， 另 一 个 的 是 
3 加 仑 。 坛 子 上 都 没有 刻度 线 。 可 以 用 水 泵 将 它们 装 满 水 。 如 何 使 4 加 仑 的 坛子 最 后 装 
有 2 加 仓 的 水 ? 

7. 扩展 练习 6 中 的 程序 ， 将 坛子 的 容量 和 较 大 的 坛子 中 最 后 的 水 量 作为 参数 。 

8. 写 一 个 程序 来 解决 这 样 一 个 问题 : 3 只 羚羊 和 3 只 狮子 准备 乘 船 过 河 ， 河 边 有 一 稻 能 容 











纳 2 只 动物 的 小 船 。 但 是 , 如 果 两 侧 河 岸上 的 狮子 数量 大 于 羚羊 数量 , 羚羊 就 会 被 吃 掉 。 
找到 运送 办 法 ,使 得 所 有 动物 都 能 安全 渡河 。 








第 8 章 


附加 内 容 








8.1 本 章 目标 


口 进一步 探索 和 扩展 前 文 介绍 的 思想 。 

口 实现 链表 。 

口 理解 RSA 公 钥 加 密 算法 ,该 算法 用 到 一 些 递 归 数 学 函数 。 
口 理解 跳 表 ， 它 是 字典 的 另 一 种 实现 形式 。 

口 理解 八 叉 树 及 其 在 图 像 处 理 中 的 应 用 。 

口 从 图 的 角度 理解 字符 串 匹 配 问题 。 


8.2 复习 Python 列表 


第 2 章 介 绍 了 Python 列表 的 一 些 大 0 性 能 限制 。 不过， 我 们 还 不 了 解 Python 是 如 何 实 现 列 
表 数 据 类 型 的 。 在 第 3 章 中 ， 你 学 习 了 如 何 用 “节点 与 引用 ”模式 实现 链表 。 但 “节点 与 引用 ” 
的 实现 在 性 能 上 仍然 不 及 Python 列表 。 本 节 将 探讨 Python 列表 的 实现 原则 。 记 住 ，Python 列表 
其 实 是 用 C 语 言 实现 的 ， 本 节 旨 在 用 Python 阐释 关键 思路 ， 而 不 是 取代 C 语 言 的 实现 。 

实现 Python 列表 的 关键 在 于 使 用 数组 ,这 种 数据 类 型 在 C、C++、Java 及 其 他 许多 编程 语言 
中 都 很 常见 。 数 组 很 简单 ， 它 只 能 存储 同一 类 型 的 数据 。 比 如 ， 可 以 定义 一 个 整数 数组 ， 也 可 以 
定义 一 个 浮 点 数 数 组 ， 但 不 能 合 二 为 一 。 数 组 只 支持 两 种 操作 : 索引 和 对 某 个 元 素 赋值 。 

理解 数组 的 最 佳 方式 是 将 它 看 作 内 存 中 连续 的 字 节 块 。 可 以 切 分 这 个 字 节 块 ， 每 一 小 块 占 n 
字 节 , n 由 数组 元 素 的 数据 类 型 决定 。 图 8-1 展示 了 存储 6 个 浮 点 数 的 数组 。 
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起 始 地 址 
图 8-1 浮 点 数 数组 


在 Python 中 ,每 个 浮 点 数 占 16 字 节 。 因 此 , 图 8-1 中 的 数组 共 占 9 字 节 。 起 始 地 址 是 指数 


组 在 


0x5eca30> 说 明 对 象 Foo 存储 于 内 存 地 址 0x5eca30。 地 址 很 重要 ， 因 为 数组 的 索引 运算 是 


( 


内 存 中 的 起 始 地 址 。 你 一 定 见 过 Python 对 象 的 内 存 地 址 ， 比 如 <__main__.Foo object a 








Ea 





过 以 下 这 个 非常 简单 的 算式 实现 的 : 


元 素 地 址 = 起 始 地 址 + 元素 下 标 x 元 素 大 小 




















假设 浮 点 数 数组 的 起 始 地 址 是 ox000040, 对 应 的 十 进 制 数 是 64。 要 计算 数组 中 位 置 4 的 元 
素 的 地 址 ， 只 需 做 算术 题 : 64+ 4 x 16 = 128。 显 然 ， 这 种 计算 的 时 间 复 杂 度 是 Od) ， 但 是 存在 


一 些 























风险 。 首 先 ， 数 组 大 小 是 固定 的 , 不 能 在 数组 末尾 无 限制 地 附加 元 素 。 其 次 , 包括 C 在 内 的 











一 些 语言 不 检查 数组 的 边界 ， 所 以 即使 数组 只 有 6 个 元 素 ， 使 用 下 标 7 赋值 也 不 是 运行 时 错误 。 


可 见 


分 的 ] 





， 这 会 带 来 难以 追踪 的 问题 。 在 Linux 操作 系统 中 ， 数 组 访问 越界 会 得 到 一 条 信息 量 并 不 充 
报错 消息 :“ 存 储 器 区 块 错 误 ”。 

Python 使 用 数组 实现 链表 的 策略 大 致 如 下 : 

口 使 用 数组 存储 指向 其 他 对 象 的 引用 (在 C 语 言 中 称 为 指针 ) ; 

口 采用 过 度 分 配 策略 ， 给 数组 分 配 比 所 需 的 更 大 的 空间 ; 

口 数组 被 填 满 后 ， 分 配 一 个 更 大 的 数组 ， 将 旧 数 组 的 内 容 复制 到 新 数组 中 。 

这 个 策略 的 效率 很 高 。 在 动手 实现 或 证 明之 前 ， 先 看 看 它 的 时 间 复 杂 度 : 

口 索引 运算 和 赋值 都 是 0(1) ; 

口 追加 操作 在 普通 情况 下 是 0(Q) ， 在 最 坏 情 况 下 是 O(n) ; 

口 从 列表 尾 弹 出 元 素 是 0(1); 

口 从 列表 中 删除 元 素 是 O(n) ; 

口 将 元 素 插入 任意 位 置 是 O(n) 。 

让 我 们 通过 一 个 简单 的 例子 来 理解 上 述 策略 。 首 先 只 实现 构造 方法 、_resize 方法 和 



































appenad 方法 ， 类 名 为 ArrayList。 构 造 方法 要 初始 化 两 个 实例 变量 : maxsize 记录 当前 数组 
的 大 小 ，lastIinaex 记录 当前 列表 的 末尾 。 由 于 Python 没有 数组 数据 类 型 ， 因 此 我 们 将 使 用 列 
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表 来 模拟 数组 。 代 码 清 单 8-1 列 出 了 这 3 个 方法 。 注 意 ， 构 造 方法 先 初始 化 上 述 两 个 实例 变量 ， 
然后 创建 一 个 不 包含 元 素 的 数组 myarray。 此 外 ， 构 造 方法 还 会 创建 一 个 名 为 sizeExponent 
的 实例 变量 。 稍 后 将 学 习 这 个 变量 的 用 法 。 


代码 清单 8-1 使 用 数组 实现 列表 的 简单 示例 














class ArrayList: 


1 

2 

3 def _ init_ (self): 

4 self.sizeExponent = 0 
5 self.maxSize = 0 

6 self.lastIndex = 0 

7 self.myArray = [] 

8 
9 


def append(self, val): 





10 if self.lastIndex > self.maxSize -1: 
11 self._ resize() 

12 self.myArray [self.lastIindex] = val 
Ee self.lastIindex += 1 

14 

15 

16 def _ resizel(self): 

ps newsize = 2 ** self.sizeExponent 
18 print ("newsize = ", newsize) 

19 newarray = [0] * newsize 

20 for i in range(self.maxSize): 

21 newarray[i] = self.myArray[il] 
22 

2 self.maxSize = newsize 

24 self.myArray = newarray 

25 self.sizeExponent += 1 























appeng 方法 做 的 第 一 件 事 (第 10 行 ) 就 是 检测 lastIngdex 是 否 超出 了 数组 允许 的 下 标 范 
围 。 如 果 超 过 ， 就 调用 _resize。 注 意 ， 我 们 使 有 约定俗成 的 双 下 划 线 ， 以 确保 resize 是 私 
有 方法 。 数 组 扩容 后 ， 新 值 被 加 到 列表 的 lastIngdex 处 ，1lastIndex 则 加 1。 

_ resize 方法 通过 2 计算 出 新 的 数组 大 小 。 扩 容 数组 有 很 多 种 方法 ， 有 些 每 次 将 数 
组 扩大 一 倍 ， 有 些 乘 以 1.5， 有 些 则 使 用 2 的 罕 。Python 采用 的 方法 是 乘 以 1.125 加 一 个 常数 。 
Python 的 开发 人 员 之 所 以 设计 这 样 的 策略 ， 是 为 了 在 各 种 CPU 和 内 存 的 速度 间 取 得 平衡 。 根 据 
这 个 策略 ， 数 组 大 小 是 这 样 的 序列 : 0, 4, 8, 16, 25, 35, 46, 58, 72, 88, … 每 次 扩容 都 会 浪费 一 些 空 
间 ， 但 便于 分 析 。 分 配 新 数组 后 ， 要 将 旧 列 表 中 的 值 复 制 到 新 数组 中 ， 在 第 20 行 开始 的 循环 做 
的 正 是 这 项 工作 。 最 后 ,必须 更 新 maxSize 和 1lastIndex, 增 加 sizeExponent ,并 将 newarray 
保存 为 self .myArray。 在 C 语 言 中 ，self .myArray 对 旧 内 存 块 的 引用 要 显 式 地 返回 给 系统 ， 
以 供 回 收 利用 。 但 是 ， 不 再 被 引用 的 Python 对 象 会 自动 地 被 垃圾 回收 算法 清理 。 

继续 学 习 之 前 , 先 分 析 为 什么 append 在 普通 情况 下 的 时 间 复 杂 度 是 0() ,在 大 部 分 情况 下 ， 
追加 元 素 ci 的 时 间 代 价 是 1。 只 有 在 lastIndex 是 2 的 宪 时 ， 代 价 才 会 变 得 更 昂贵 ， 即 
Ol(lastIndex) 。 可 以 将 插入 第 i 个 元 素 的 代价 总 结 如 下 : 
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i 

















_ Ji(Gi 是 2 的 暴 ) 
| 1 (其 他 情况 ) 

由 于 复制 1ast Index 个 元 素 的 情况 相对 较 少 ， 因 此 可 以 将 它 的 代价 均 分 一 一 也 叫 作 均 摊 一 一 
到 所 有 追加 操作 上 。 这 样 一 来 ,追加 操作 的 平均 时 间 复 杂 度 就 变 为 0() 。 举 个 例子 ,考虑 已 经 加 
了 4 个 元 素 的 情况 。 对 于 大 小 为 4 的 数组 ， 此 前 的 每 次 追加 操作 都 只 需 向 数组 中 存储 一 个 元 素 即 
可 。 在 追加 第 5 个 元 素 时 ，Python 分 配 一 个 大 小 为 8 的 新 数组 ， 并 将 原来 的 4 个 元 素 复制 过 来 。 
不 过 ， 现 在 多 出 一 些 空间 ， 可 供 进行 4 次 低 代 价 的 追加 操作 。 用 数学 公式 表示 如 下 : 











lgn 

总 代价 =n+》 2 
j=0 
=Nn+2n 


=3n 

以 上 等 式 中 的 累加 可 能 不 容易 理解 ， 我 们 来 仔细 研究 。 此 处 的 累加 是 从 0 加 到 以 2 为 底 n 的 
对 数 。 上 界 告 诉 我 们 需要 给 数组 扩容 多 少 次 。2’ 表明 数组 扩容 时 要 复制 多 少 次 。 既 然 扎 加 个 元 
素 的 总 代价 是 3n ， 那 么 平均 到 每 个 元 素 就 是 3n/n=3 。 这 是 一 个 常数 ， 所 以 我 们 说 时 间 复 杂 度 
是 0() 。 这 种 分 析 被 称 为 均 摊 分 析 ， 它 在 分 析 高 级 算法 时 很 有 用 。 
下 面 讨论 索引 操作 。 代 码 清单 8-2 给 出 了 索引 和 赋值 的 Python 实现 。 前 面 讨论 过 ,要 找到 数 
组 中 第 i 个 元 素 的 内 存 地 址 ， 只 和 需 使 用 一 个 时 间 复 杂 度 为 O0) 的 算式 。 即 使 是 C 语言， 也 将 这 个 
算式 隐藏 在 一 个 漂亮 的 数组 索引 运算 符 背 后 ,在 这 一 点 上 , C 和 Python 倒是 达成 了 一 致 。 实 际 上 ， 
Python 在 这 样 的 运算 中 很 难 获取 对 象 实际 的 内 存 地 址 , 所 以 我 们 使 用 列表 内 置 的 索引 运算 符 。 如 
果 你 对 此 有 疑惑 ， 可 以 查看 Python 源 代码 中 的 listobj.c 文件 。 


代码 清单 8-2 ”索引 操作 































































































1 def _ getitem (self, idx): 

有 if idx < self.lastIindex: 

3 return self.myArray [idx] 

4 else: 

5 raise LookupError('index out of bounds') 
6 

7 def _ setitem (self, idx, val): 

8 if idx < self.lastIindex: 

9 self.myArray[idx] = val 

0 else: 

于 raise LookupError('index out of bounds') 











最 后 来 看 看 代价 更 昂贵 的 搬入 操作 。 往 ArrayList 中 插入 元 素 时 ， 需 要 先 将 从 插入 点 起 的 
所 有 元 素 往 前 挪 一 位 ， 从 而 为 待 插 元 素 腾 出 空间 。 图 8-2 展示 了 这 个 过 程 。 
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4 3 2 1 








插入 点 lastIindex maxSize 





插入 点 lastIndex maxSize 





插入 点 lastIndex maxSize 
图 8-2 往 ArrayList 中 下 标 为 2 的 位 置 插 入 元 素 27.1 


正确 实现 insert 的 关键 是 , 在 移动 数组 中 的 元 素 时 , 不 能 覆盖 任何 重要 数据 。 要 做 到 这 一 点 ， 
应 该 从 列表 未 尾 开 始 复制 数据 。 代 码 清单 8-3 给 出 了 insert 方法 的 实现 。 注 意 第 4 行 如 何 设置 范 
围 ， 以 确保 先 将 已 有 的 数据 复制 到 未 使 用 的 空间 ， 然 后 才 复 制 后 续 的 值 并 覆盖 已 移 走 的 值 。 如 果 
for 循环 从 插 和 人 点 开始 ， 将 值 往 下 一 个 位 置 复制 ， 那 么 下 一 个 位 置 上 的 旧 值 就 再 也 找 不 回来 了 。 






















































































代码 清单 8-3 ”ArrayList 类 的 insert 方法 





1 def insert (self, idx, val): 

2 if self.lastIindex > self.maxSize - 1: 

3 self.__resize() 

4 for i in range(self.lastIindex, idx-1, -1): 
5 self.myArray[i+1] = self.myArray[i] 

6 self.lastIindex += 1 

7 self.myArray[idx] = val 
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插入 操作 的 时 间 复 杂 度 是 O(n) ， 因 为 在 最 坏 情况 下 ， 即 在 位 置 0 处 插入 元 素 ， 需 要 将 所 有 
元 素 都 挪 一 位 。 普 通 情 况 是 只 挪 一 半 元 素 ， 但 时 间 复 杂 度 仍然 是 O(n) 。 请 回 到 第 3 章 ， 复 习 如 
何 使 用 “节点 与 引用 ”模式 实现 列表 操作 。 实 现 没有 对 错 之 分 ， 只 不 过 不 同 的 实现 有 着 不 同 的 性 
能 。 具 体 来 说 ， 是 在 表 头 加 入 元 素 ,， 还 是 在 表 尾 ? 是 要 从 列表 中 删除 元 素 , 还 是 只 往 列表 中 添加 
元 素 ? 

对 于 ArrayList, 还 有 一 些 有 趣 的 操作 没有 实现 ,包括 pop ,ael 、ingex 以 及 让 ArrayList 
支持 迭代 。 对 这 些 操作 的 实现 留 作 练 习 。 


8.3 复习 递归 


数值 计算 最 常见 的 一 个 应 用 领域 是 密码 学 。 每 次 查看 银行 账户 , 或 者 登录 在 线 购物 网 站 或 计算 
机 时 ,你 都 在 应 用 密码 学 。 一 般 来 说 ， 密 码 学 研究 的 是 如 何 加 密 和 解密 信息 。 本 节 将 介绍 在 密码 学 
编程 中 常用 的 一 些 函 数 。 其 中 每 一 个 都 能 用 递归 实现 ， 不 过 在 实践 中 可 能 存在 更 快 的 实现 方法 。 

本 闻 会 用 到 Python 的 取 余 运算 符 (% )。 你 也 许 记得 ，a % b 是 a 除 以 5 后 剩余 的 部 分 ， 比 
如 10 % 7 = 3。 任何 对 10 取 余 的 数学 表达 式 ， 其 结果 都 只 能 在 0~9 中 。 

最 早 的 一 种 加 密 方 法 使 用 了 简单 的 取 余 运算 。 以 字符 串 uryybjbeyq 为 例 ， 你 能 猜 出 原文 
是 什么 吗 ? 代码 清单 8-4 给 出 了 生成 密 文 的 代码 。 试 试 能 否 根 据 代码 推导 出 原文 。 


代码 清单 8-4 ”简单 的 取 余 加 密 函 数 








































































































1 def encrypt (m): 

2 s = 'abcdefghijklmnopqrstuvwxyz' 
3 和 

4 fOr Tm Tm 

5 j = (s.find(i)+13)%26 

6 n= n+ s[j] 

ys return n 








encrypt 了 荫 数 展示 了 一 种 被 称 为 “凯撒 密码 ”的 加 密 形式 。 它 还 有 一 个 描述 性 更 强 的 名 字 ， 
rot13。encrypt 对 原文 中 的 每 个 字母 在 字母 表 中 移动 13 个 位 置 ,如果 超 出 字母 表 , 就 回 到 开 
头 。 这 个 函数 可 以 轻松 地 由 取 余 运算 符 实现 。 另 外 ,字母 表 有 26 个 字母 ， 所 以 这 个 函数 是 对 称 
的 。 对 称 性 是 指 可 以 用 同一 个 函数 进行 加 密 和 解密 。 如 果 向 encrypt 函数 传 信 字符 串 
uryybjbeyq， 得 到 的 就 是 hellowor1ld。 

除了 13 以 外 ， 其 他 数字 也 可 以 ， 但 加 密 和 解密 就 不 对 称 了 。 如 果 不 对 称 ， 就 需要 编写 解密 
函数 decrypt。 可 以 让 encrypt 函数 和 decrypt 函数 都 将 轮换 数 作为 参数 。 在 密码 学 术语 中 ， 
轮换 参数 称 为 “ 密 钥 ”"， 即 移动 多 少 位 。 给 定 消息 和 密 钥 ， 加 密 算法 和 解密 算法 就 能 工作 了 。 代 
码 清单 8-5 给 出 了 以 轮换 数 作为 参数 的 解密 函数 。 作 为 练习 ， 你 可 以 尝试 修改 代码 清单 8-4 中 的 
加 密 函 数 ， 使 它 将 密 钥 作为 参数 。 
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8.3 





代码 清单 8-5 ”使 用 密 钥 解密 





1 def decrypt (m, k): 

入 s = 'abcdefghijklmnopqrstuvwxyz' 
3 1 

4 fOr E> Ti 

5 j= (s.find(i)+26-k) % 26 

6 n= n+ s[j] 

7 return n 





即使 你 只 将 密 钥 告 诉 接收 方 , 这 么 简单 的 加 密 算法 也 无 法 长 久 地 保护 信息 。 接 下 来 , 我 们 将 
构建 一 个 安全 得 多 的 加 密 方 法 一 一 RSA 公 钥 加 密 算法 。 


8.3.1 同 余 定理 

如 果 两 个 数 a 和 5b 除 以 4 所 得 的 余数 相等 ,我 们 就 说 a 和 25“ 对 模 n 同 余 ”, 记 为 a=b(mod nn) 。 
本 节 中 的 算法 将 利用 3 条 重要 的 同 余 定理 。 

(1) 如 果 a=b(lmodn) ， 那么 Vc,a+c=b+c(modn)。 

(2) 如 果 a=b(mod n) ， 那么 Ve,ac=bc(modn) 。 

(3) 如 果 a=b(mod n) ， 那么 Vp,p > 0,a” =b?(modn)。 





8.3.2 军 剩 余 

假设 我 们 想 知道 32 的 最 后 一 位 数 。 问 题 在 于 , 不仅 计算 量 大 ,而且 使 用 Python 的 “无 限 
精度 ”整数 ， 这 个 数字 有 598 743 位 ! 但 是 , 我 们 只 想 知道 最 后 一 位 数 。 这 其 实 是 两 个 问题 : 一 、 
如 何 高 效 地 计算 x”"? 二 、 如 何 能 在 不 必 算 出 所 有 598 743 位 数 的 前 提 下 ， 计算 x” (mod p)? 

运用 上 述 第 3 条 同 余 定理 ， 不 难 解决 第 2 个 问题 。 

(1) 将 result 初始 化 为 1。 

(2) 重复 n 次 : 
口 (a) 用 result 乘 以 xi; 























这 样 就 简化 了 计算 ,因为 我 们 一 直 让 result 保持 为 一 个 较 小 的 值 , 而 不 是 精确 地 算出 最 终 
结果 。 但 是 ， 利 用 递归 还 能 做 得 更 好 。 

i (x: x) 7 为 偶数 时 

(GD=xOcOb2 1 为 奇数 时 

对 于 浮 点 数 2， 向 下 取 整 | z | 得 到 的 是 小 于 n 的 最 大 整数 。Python 的 整数 除法 就 是 对 除法 结 

果 疝 下 取 整 ， 所 以 不 必 有 额外 编写 代码 。 以 上 等 式 为 计算 x" 给 出 了 很 好 的 递归 定义 。 现 在 只 缺 基 
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本 情况 。 你 应 该 记得 ， 对 于 任意 数 x， 有 x =1。 由 于 每 次 递归 调用 都 会 减 小 指数 ， 因 此 n=0 就 
是 很 好 的 基本 情况 。 

在 以 上 等 式 中 , 奇数 和 偶数 的 情况 都 有 因子 (x ,所 以 对 它 的 计算 不 做 条 件 判断 ,并 将 
它 存 到 变量 tmp 中 。 还 要 注意 一 点 ， 每 一 步 都 进行 取 余 运算 。 在 代码 清单 8-6 的 实现 中 , 结果 始 
终 较 小 ， 乘 法 运算 的 次 数 也 比 纯 循 环 方案 要 少 得 多 。 


代码 清单 8-6 ”x”(mod p) 的 递归 定义 














def modexp (x, n, p): 

2 Ei i 区 三 三 浊 : 

3 return 1 

4 Gc 

5 tmp = modexp(t, n//2, p) 
6 if ng2 != 0: 

7 tmp = (tmp * x) $ p 
8 return tmp 





8.3.3 ”最 大 公 因 数 与 朔 元 


下 整数 x 关于 模 m 的 逆 元 a 满足 ax=lmod m) 。 比 如 x=3, m=7, a=5，3x5=15， 
15%7=1， 所 以 5 是 3 关于 模 7 的 逆 元 。 咎 一 看 ， 逆 元 这 个 概念 令 人 困惑 。 这 个 例子 中 的 5 是 怎 
么 选 出 来 的 呢 ? 5 是 3 关于 模 7 的 唯一 道 元 吗 ? 给 定 任意 数 m， 所 有 的 数 都 有 道 元 吗 ? 

我 们 来 看 个 例子 ， 可 能 会 对 解答 第 一 个 问题 有 所 启发 。 请 看 下 面 这 个 Python 会 话 : 


>>> for i in range(1, 40): 
i 7 二 
print i 


















































这 个 小 实验 告诉 我 们 ，, 当 x =3 、m=7 时 , 存在 多 个 道 元 : 5, 12, 19, 26,33, …。 对 这 个 数列 ， 
你 发 现 什 么 有 趣 之 处 了 么 ”其 中 每 个 数 都 是 模 7 的 某 个 倍数 减 2。 

对 于 任意 的 x 和 m， 都 存在 首 元 吗 ? 来 看 男 一 个 例子 。 假 设 x=4，m =8 。 如 果 将 4 和 8 插 
入 前 一 个 例子 的 循环 中 ， 什 么 也 得 不 到 。 如 果 去 掉 条 件 判 断 语句 ， 打 印 (4 * i) s 8 的 结 
就 得 到 数列 0, 4, 0, 4, 0,4, …。0 和 4 交替 出 现 , 但 显然 永远 不 会 出 现 1。 如 何 预知 这 一 点 呢 ? 

答案 是 ， 当 日 仅 当 m 和 x 互 素 时 , x 关于 模 m 才 有 逆 元 。 互 素 是 指 gcd(m,x) =1。 你 应 该 记 
得 ， 两 个 数 的 最 大 公 因 数 ( greatest common divisor，GCD ) 是 能 整除 它们 的 最 大 整数 。 那 么 ， 如 
何 计算 两 个 数 的 最 大 公 因 数 呢 ? 
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给 定 两 个 数 a 和 4b, 要 找到 它们 的 最 大 公 因 数 , 可 以 反复 计算 a-b ,直到 a <b。 当 a<b 时 ， 
交换 a 和 b。 当 a-b=0 时 ， 再 次 交换 。 此 时 ，gcd(a,0) = a 。 这 就 是 欧 几 里 得 算法 ， 它 已 经 有 
2000 多 年 的 历史 了 。 

在 用 于 设计 递归 时 , 欧 几 里 得 算法 非常 简单 ,基本 情况 就 是 b=0 。 有 两 种 递归 调用 : 若 wc<2 ， 
交换 a 和 b， 发 起 递归 调用 ; 否则 ， 在 递归 调用 时 用 a-b 替换 a。 代 码 清单 8-7 给 出 了 欧 几 里 得 
算法 的 实现 。 


代码 清单 8-7 利用 欧 几 里 得 算法 求 最 大 公 因数 








def gcd(a, b): 

这 Tf ee 

3 return a 

4 elif a < b: 

5 return gcd(b, a) 

6 else: 

7 return gcd(a-b, b) 





尽管 欧 几 里 得 算法 易于 理解 和 编程 ,但 还 不 够 高 效 ， 在 a >b"> 时 尤其 如 此 。 不 过 , 模 运算 又 
一 次 派 上 用 场 。 当 4-b<b 时 , 减法 结果 等 于 a 除 以 5 的 余数 。 明白 了 这 一 点 , 就 可 以 去 掉 减 法 ， 
而 仅 用 一 个 递归 调用 交换 a 和 2。 代码 清单 8-8 给 出 了 改良 后 的 算法 。 
代码 清单 8-8 改良 后 的 欧 几 里 得 算法 








1 def gcd(a, b): 

2 Lf 二 三 人 

3 return a 

4 else: 

5 return gcd(b, a %$ b) 














现在 我 们 有 了 判断 是 否 有 逆 元 的 方法 , 下 一 个 任务 就 是 实现 能 高 效 地 计算 出 逆 元 的 算法 。 假 
设 对 于 任意 数 x 与》， 我们 都 可 以 计算 出 gcd(x,y) 以 及 一 对 整数 a 和 2， 满足 
d = gcd(x;y)=axt+by。 比 如 ，1= gcd(G3,7)=-2x3+1x7 ， 所 以 -2 和 1 就 可 以 分 别 作为 a 和 5 的 
解 。 使 用 前 一 个 例子 中 的 m 和 x 来 蔡 换 x 和 yy， 得 到 1= gcd(m,x) =am+bx 。 由 本 节 开 头 的 讨论 
可 知 ，bx=1(mod m) ， 所 以 5 是 x 关于 模 m 的 一 个 道 元 。 


我 们 已 经 将 计算 逆 元 的 问题 简化 为 寻找 满足 等 式 4 = gcd(x,y) =ax+by 的 整数 a 和 b。 既 然 
一 开始 通过 gca 函数 解决 这 个 问题 ， 那 么 就 让 我 们 通过 扩展 它 来 收尾 吧 。 取 两 个 数 x>= y ， 返 
回 元 组 (4,a,5) ， 满 足 d = gcd(x,y) 且 4 =ax+by 。 对 gca 函数 的 扩展 如 代码 清单 8-9 所 示 。 
代码 清单 8-9 扩展 gca 函数 





























def ext_gcd(x, y): 

2 LE Es "Os 

3 retUuri(X, 1. 0) 

4 else: 

5 (di; ar b) = ext gcd (ly; XSY) 
6 return(d, b, a- (x//y)*b) 
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为 了 理解 扩展 后 的 gca 函数 ,来 看 一 个 例子 。 假设 x=25，y =9。 图 8-3 展示 了 这 个 递归 卫 
数 的 调用 和 返回 值 。 

















pe 


(drabB) = "00d{9 7 
return 1,-4,-3-25/9*4 














(1,-3.,4) 








EY 








pd,a,b) = gcd(7,2) 
POLUEH. Ld -9 











人 








人 








pd,a,b) = gcd(2,1) 
return 1,1,0-7/2*1 [EE 


(1,0,1) 
Re 
(二 站 CT) 


return 1,0,1-2/1*0 | 









































-| (d,a,b) = gcd(1,0) 
return 1,0,1-1*0 由 | 

















ee 








一 | TeLurn 1,1,0 




















图 8-3 ext_gcad 也 数 的 调用 树 


与 原始 的 欧 几 里 得 算法 一 样 ， 当 基本 情况 y=0 出 现时 , 返回 4 =x。 不 过 , 还 返回 了 另 两 个 
值 : a=1 与 5=0 。 这 3 个 值 满足 4=axt+by 。 如 果 y>0 ， 就 递归 计算 (q,a,b) ， 使 得 
d = gcd(y,x mody) 且 d =ay+b(x mody)。 和 原始 算法 一 样 ，d = gcd(x,y)。 但 男 两 个 值 a 和 4 
呢 ? 我 们 知道 , a 和 45 一定 是 整数 , 因此 分 别 记 为 A 和 B, 也 就 有 qd = 4x+By 。 为 了 计算 A 和 了 B， 
重新 整理 等 式 : 














d =ay+b(x mod y) 
=ay+b(x—|x/y|y) 
=bx+(a—|x/y|D)y 
注意 ，x mody =x-|z/7 | 。 这 没 问 题 ， 因 为 这 就 是 计算 x/ y(x mody) 余 数 的 方式 。 从 最 后 
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的 等 式 可 以 看 出 ，4 = 且 B=a-|x/y|b。 这 就 是 代码 清单 8.9 第 6 行 所 做 的 ! 注意 , 算法 中 每 
一 步 返 回 的 值 都 满足 4 = ax+by 。 


8.3.4 RSA 算法 


至 此 ， 我 们 已 经 备 齐 了 编写 RSA 算法 所 需 的 全 部 工具 。 可 以 说 ，RSA 算法 是 最 易于 理解 的 
公 钥 加 密 算 法 。 公 钥 加 密 的 概念 由 Whitfield Diffie 、Martin Hellman 和 Ralph Merkle 提出 ， 它 对 
密码 学 的 主要 贡献 在 于 密 钥 成 对 的 思想 : 加 密 密 钥 用 于 明文 到 密 文 的 转换 , 解密 密 钥 用 于 密 文 到 
明文 的 转换 。 密 钥 都 是 单 向 的 ， 所 以 用 私 钥 加 密 的 信息 只 能 用 公 钥 解密 ， 反 之 亦 然 。 


RSA 算法 的 安全 性 来 自 于 大 数 分 解 的 难度 。 公 钥 和 私 钥 由 一 对 大 素数 (100~200 位 ) 得 到 。 
既然 Python 中 有 原生 的 长 整数 ， 那么 RSA 算法 实现 起 来 就 十 分 有 趣 且 容易 。 


要 生成 两 个 密 钥 ， 选 两 个 大 素数 p 和 gq， 并 计算 它们 的 乘积 。 
n=pxg 
下 一 步 是 随机 选择 加 密 密 钥 e， 使 得 e 与 (p-Dx(yg-1T 互 素 。 
gcd(e,(p—l)x(g—1))=1 
加 密 密 钥 4 就 是 e 关 于 模 (p 一 1)x(g 一 ]) 的 道 元 ,在 这 里 ,可 以 使 用 欧 几 里 得 算法 的 扩展 版 本 。 


e 入 一 起 组 成 公 钥 ，4 则 是 私 钥 。 算 出 e、n 和 4d 之后， 最初 的 素数 p 和 g 就 没 用 了 ,但 仍 
然 不 应 该 泄露 它们 。 


加 密 时 ， 只 需 使 用 c=m*(mod n) 。 解 密 时 ， 则 使 用 m= c (modn) 。 
如 果 记 得 4 是 e(modn) 的 逆 元 ， 就 很 容易 理解 。 







































































c” = (me) (modn) 
=m" (mod n) 
=m! (mod n) 
=m(mod n) 
在 将 等 式 转化 为 Python 代码 之 前 ， 需 要 讨论 一 些 细节 。 如 何 将 hello world 这 样 的 文本 信息 
转化 成 数字 ?最 简单 的 方法 就 是 把 每 个 字符 的 ASCII 值 拼接 起 来 。 不 过 ， 由 于 十 进 制 的 ASCII 
值 位 数 不 国 定 ， 因 此 使 用 十 六 进 制 ， 因 为 我 们 确信 两 位 的 十 六 进 制 数 代表 一 字 节 或 一 个 字符 。 


Nn e 业 oO Ww O 法 于 Q 
104 101 108 108 111 32 119 111 114 108 100 
868 G5 ‘6G 6G 6f ONY bf YJ2 “GG G4 


拼接 所 有 的 十 六 进 制 数 ， 再 将 得 到 的 大 数 转换 为 十 进 制 整 数 。 
m=126207244316550804821666916 
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Python 可 以 很 好 地 处 理 这 个 大 数 。 但 实际 使 用 RSA 算法 加 密 的 程序 会 将 明文 切 分 成 小 块 ， 
对 每 一 块 加 密 ， 这 样 做 有 两 个 原因 。 第 一 个 原因 是 性 能 。 即 使 一 条 较 短 的 电子 邮件 消息 ， 比 如 大 
小 为 ]I 的 文本 ， 生 成 的 数 也 会 有 2000~3000 位 ! 如 果 再 取 4 次 方 -有 10 位 一 一 这 可 是 一 个 
相当 大 的 数 ! 

第 二 个 原因 是 限制 条 件 m 三 n 。 必 须 确保 消息 的 模 n 表示 是 唯一 的 。 举 例 来 说 ,，p 和 4 分 别 
取 5563 和 8191。n=5563x8191=45 566 533 。 为 了 保持 分 块 的 整数 小 于 m， 我 们 将 消息 切 分 成 
小 于 表示 n 所 需 的 字 节 数 。 在 Python 中 使 用 整 型 方法 bit_length 很 容易 得 到 位 数 。 有 了 表示 
数字 所 需 的 位 数 ， 除 以 8 就 是 字 节 数 。 消 息 中 的 每 个 字符 都 由 一 字 节 表示 ， 这 个 除法 告诉 我 们 的 
就 是 每 一 块 的 字 节 数 。 因 此 ， 可 以 方便 地 将 消息 分 成 n 个 字符 的 块 , 将 每 一 块 的 十 六 进 制 表 示 转 
换 成 整数 。 本 例 中 ,可 以 使 用 26 位 表示 45 566 533。 使 用 整数 除法 除 以 8， 得 知 应 该 将 消息 切 分 
成 3 个 字符 的 块 。 

字符 h、e 和 1 的 十 六 进 制 值 分 别 是 68、65 和 6c, 拼 起 来 就 是 68656c, 转 成 整数 就 是 6841708。 













































































m! = 6841708 
m’? =7106336 
m; = 7827314 
m’* = 27748 
注意 ， 切 分 消息 可 能 会 很 复杂 ， 当 转换 后 得 到 的 数字 不 足 7 位 时 尤其 如 此 。 在 这 种 情况 下 ， 
拼接 时 要 在 结果 前 小 心地 补 上 0”。 
现在 选择 e 的 值 , 可 以 随机 取 值 , 并 用 (p-Dx(g-D=45 552 780 检验 。 记 住 ,e 和 45 552 780 
互 素 。 对 于 这 个 例子 ，1471 就 很 合适 。 
d =ext_gcd(45552780,1471) 
=—11705609 
=45552780 一 11705609 
=33847171 
我 们 用 这 一 信息 来 加 密 第 一 个 消息 块 : 
c=6841708'"! (mod 45566533) =16310024 
解密 ec， 确保 能 得 到 原来 的 值 : 
m =16310024”*17! (mod 45566533) = 6841708 
可 以 用 同样 的 过 程 加 密 剩 下 的 块 ， 然 后 一 起 作为 密 文 发 送 。 
































Q@ 是 否 补 零 ， 应 该 要 看 十 六 进 制 形 式 的 位 数 是 奇数 还 是 偶数 。 请 参考 代码 中 的 逻辑 。 一 一 译 者 注 
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接 下 来 看 3 个 Python 函数 ， 如 代码 清单 8-10 所 示 。RSAgenKeys 根据 p 和 gq 创建 一 个 公 钥 
和 一 个 私 钥 。RSAencrypt 接受 一 段 消息 、 公 钥 和 nn， 并 返回 密 文 。RSAdecrypt 接受 密 文 、 私 
钥 和 n， 并 返回 原始 消息 。 


以 下 是 运行 结果 的 示例 。 


>>> ee, d, n = RSAgenKeys (5563, 8191) 

>>> C = RSAencrypt ('goodbye girl', e, n) 
$2 

[17194224, 5988784, 2786637, 23090820] 
>>> m = RSAdecrypt (c, d, n) 

~ I 

'goodbye girl1' 























代码 清单 8-10 RSA 算法 的 实现 





工 def RSAgenKeys (D，d) : 
2 n=p*gqg 
3 paqminus = (p-1) * (q-1) 
4 e = int(random.random() * n) 
号 while gcd(paqminus, e) != 1: 
6 e = int(random.random() * n) 
3 d, a, b = ext_gcd(pqminus, e) 
8 LE: 0 
9 d = paqminus + b 
else: 
< 


return((e, d, n)) 


def RSAencrypt (m,e,n): 
chunks = toChunks(m, n.bit_length() // 8 * 2) 
encList = [] 
for messChunk in chunks: 
C = modexp(messChunk, e, n) 
encList.append!(c) 
return encList 





def RSAdecrypt (chunkList, d, n): 
TT SES [EE] 
for c in chunkList: 
m = modexp (c,d,n) 
xzList .append (m) 
return chunksToPlain(rList，n.bit_length() // 8 * 2) 


te By TO hy BD RE et ee es ES ok 
OVOODPO OW OWV OPO 


DD 
-J 





最 后 看 两 个 将 字符 串 切 分 成 块 的 辅助 函数 ， 它 们 利用 了 Python 3.x 的 一 个 新 特性 : 字 节 数组 
可 以 将 字符 串 存 储 为 字 节 序列 。 这 样 一 来 ,就 可 以 方便 地 进行 字符 串 与 十 六 进 制 序列 之 间 的 转换 。 
从 代码 清单 8-11 中 可 以 看 到 将 字符 串 转换 为 数字 块 列表 的 过 程 。 有 一 点 要 注意 ， 必 须 确 保 
字符 对 应 的 十 六 进 制 数 一 直 是 两 位 。 这 意味 着 有 时 需要 补 零 ， 可 以 用 字符 串 格 式 化 表达 式 























,s02x，s b 轻松 搞定 。 这 个 表达 式 创建 包含 两 个 字符 的 字符 串 ， 并 且 在 必要 时 在 前 面 补 零 。 根 ce 
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据 整 条 消息 得 到 一 个 长 的 十 六 进 制 字符 串 后 ， 可 以 将 长 串 切 分 成 numchunks 个 十 六 进 制 数 块 。 
这 就 是 for 循环 要 做 的 工作 。 最 后 用 eval 函数 和 列表 解析 式 将 每 个 十 六 进 制 数 转换 为 整数 。 





代码 清单 8-11 将 字符 串 转换 为 数字 块 列表 





下 def tochunks (m, chunkSize) : 

2 byteMess = bytes(m, 'utf-8') 

2 hexostring: se. ™" 

4 for b in byteMess: 

2 hexString = hexString + ("%02x" % b) 
6 

7 

8 

9 


numChunks = len(hexSstring) // chunkSize 
chunkList = [] 

for i in range(0, numChunks*chunkSize+l1l, chunkSize): 
chunkList.append (hexString[i:i+chunkSize]) 
chunkList = [eval('O0x'+x) for x in chunkList if x] 
return chunkList 





chunksToplain(clist, chunkSize): 
hexList = [] 

FOP VE In Cle 

hexString = hex(c) [2:] 

clen = len(hexString) 


OOODOPO 
[en 
[0 
是 








19 hexList.append('0' * ((chunkSize - clen) % 2) 
20 + hexSstring) 

2 

2 hstring = "" .join(hexList) 

23 messArray = bytearray.fromhex(hstring) 

24 return messArray.decode('utf-8') 








将 加 密 块 转换 回 字符 串 ， 和 创建 一 个 长 的 十 六 进 制 字符 串 并 转换 为 pytearray 一 样 容易 。 


bytearray 内 置 的 decode 函数 将 字 节 数组 转换 为 字符 串 。 唯 一 需要 注意 的 是 














， 块 表示 的 数字 





可 能 明显 小 于 原始 的 数字 。 在 这 种 情况 下 , 需要 补 零 , 以 确保 所 有 块 在 拼接 时 是 等 长 的 。 通 过 ' 0， 























* ((chunkSize - clen) % 2) 把 零 前 置 ， 其 中 chunksize 是 字符 串 中 应 有 的 位 数 ，clen 则 





是 实际 的 位 数 。 


8.4 复习 字典 : 跳 表 

















字典 是 Python 中 用 途 最 广 的 集合 之 一 。 字 典 也 常 被 称 作 映射 ， 它 存储 的 是 键 - 值 对 。 键 与 某 

















个 特定 的 值 关联 ， 且 必须 是 不 重复 的 。 给 定 一 个 键 ， 映射 可 以 返回 对 应 的 值 。 介 





映射 中 加 入 键 - 








值 对 ， 以 及 根据 键 查询 值 ， 这 些 是 映射 的 基本 操作 。 

举 个 例子 ， 图 8-4 展示 了 一 个 包含 键 - 值 对 的 映射 。 其 中 ， 键 是 整数 ， 值 是 
的 单词 。 从 逻辑 角度 看 ， 对 与 对 之 间 不 存在 顺序 。 不 过 ， 如 果 给 定 一 个 键 (如 9 
它 所 关联 的 值 (be )。 

















由 两 个 字母 组 成 
3 )， 就 可 以 得 到 
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图 8-4 映射 示例 


8.4.1 映射 抽象 数据 类 型 
映射 这 一 抽象 数据 类 型 由 下 面 的 结构 和 操作 定义 。 如 前 所 述 ， 映 射 是 键 - 值 对 的 集合 ， 可 以 
通过 键 访问 关联 的 值 。 映 射 支持 以 下 操作 。 
口 Map () 创建 一 个 空 的 映射 。 它 不 需要 参数 ， 并 会 返回 一 个 空 的 映射 集合 。 
D put (key，value) 往 映射 中 加 入 一 个 键 - 值 对 。 需 要 传人 键 及 其 关联 的 值 ， 没 有 返回 
值 。 这 里 假设 要 添加 的 键 不 在 映射 中 。 
D get (key ) 在 映射 中 搜索 给 定 的 键 ， 并 返回 它 对 应 的 值 。 
注意 ， 有 映射 抽象 数据 类 型 还 支持 其 他 一 些 操作 。 我 们 会 在 练习 中 探讨 。 


























8.4.2 用 Python 实现 字典 


我 们 已 经 了 解 了 多 种 实现 映射 的 有 趣 方法 。 在 第 5 章 ， 我 们 探讨 了 如 何 用 散 列 表 实 现 映射 。 
给 定 一 组 键 和 一 个 散 列 函数 ， 可 以 将 键 放 到 集合 中 ,并 搜索 和 取出 关联 的 值 。 我 们 分 析 过 ， 这 种 
搜索 操作 的 时 间 复 杂 度 是 O0) 。 不 过 , 性 能 会 因为 表 的 大 小 、 冲突、 冲突 解决 策略 等 因素 而 降低 。 
第 6 章 探讨 了 用 二 又 搜索 树 实 现 映射 。 当 把 键 存储 在 树 中 时 ， 搜 索 操 作 的 时 间 复 杂 度 是 
O(logn) 。 不 过 ， 这 只 有 在 树 平 衡 时 才 成 立 ， 即 树 的 左右 子 树 要 差不多 大 。 不 幸 的 是 ， 根 据 插入 
顺序 ， 键 可 能 左倾 或 右倾 ， 搜 索性 能 随 之 下 降 。 

本 节 要 解决 的 问题 就 是 给 出 一 种 实现 方法 ， 既 能 高 效 搜索 ,又 能 避免 上 述 缺 点 。 一 种 解决 方 
案 是 使 用 跳 表 。 图 8-5 给 出 了 上 例 的 键 - 值 对 集合 可 能 对 应 的 一 个 跳 表 ( 后面 会 说 明 为 什么 说 “可 
能 ”)。 如 你 所 见 ， 跳 表 其 实 就 是 二 维 链表 ,链接 的 方向 向 前 ( 也 就 是 向 右 ) 或 向 下 。 表 头 在 图 中 
的 左上 角 ， 它 是 跳 表 结构 唯一 的 人 口 。 






















































































266 第 8 章 附加 内 容 

















图 8.5 跳 表 示例 

深入 学 习 跳 表 之 前 ， 有 必要 理解 一 些 术 语 的 含义 。 图 8-6 展示 了 跳 表 的 主要 结构 ， 跳 表 由 一 
些 数据 节点 构成 ， 每 个 节点 存 有 一 个 键 及 其 关联 的 值 。 此 外 ， 每 个 节点 还 有 两 个 向 外 的 引用 。 
8-7 展示 了 单个 数据 节点 的 详情 。 








图 8-6 ” 跳 表 的 主体 HH 





图 8-7 单个 数据 节点 


图 8-8 展示 了 两 种 不 同 的 纵 列 。 最 左边 的 一 列 由 头 节点 的 链表 组 成 。 每 个 头 节点 都 有 两 个 引 
用 ， 分 别 是 down 和 next。down 引用 指向 下 一 层 的 头 节点 ，next 引用 指向 数据 节点 的 链表 。 
图 8-9 展示 了 头 节 点 的 详情 。 
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图 8-8” 头 节点 和 塔 


down next 


Eu 


图 8-9 ”每 个 头 节点 都 有 两 个 引用 


由 数据 节点 构成 的 纵 列 称 作 塔 。 塔 是 由 数据 节点 中 的 sown 引用 连 起 来 的 。 可 以 看 出 ， 每 一 
座 塔 都 对 应 一 个 键 - 值 对 ， 并 且 塔 的 高 度 不 一 。 后 文 在 探讨 如 何 往 跳 表 中 添加 数据 时 ， 会 解释 如 
何 确定 塔 的 高 度 。 

8-10 突出 展示 了 水 平方 向 上 的 节点 集合 。 仔 细 观 察 后 会 发 现 ， 每 一 层 实际 上 都 是 由 数据 
节点 组 成 的 有 序 链表 ， 其 顺序 由 键 决定 。 每 个 链表 都 有 自己 的 名 字 , 通常 用 其 层 数 指 代 。 层 数 从 
0 开始 , 底层 就 是 第 0 层 , 包括 整个 节点 集合 。 每 个 键 - 值 对 都 必须 出 现在 第 0 层 的 链表 中 。 不 过 ， 
层 数 越 高， 节点 数 就 越 少 。 跳 表 的 这 个 重要 特征 有 助 于 提高 搜索 效率 。 可 以 看 到 ， 每 一 层 的 节点 
数 和 塔 的 高 度 息 息 相 关 。 

表 头 






























































图 8-10 水 平方 向 上 的 每 一 组 数据 节点 构成 一 层 
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上 述 两 种 节点 的 构建 方式 与 构建 简单 的 链表 类 似 。 头 节点 〈 详 见 代码 清单 8-12 ) 由 next 和 
down 两 个 引用 构成 ， 构 造 方法 将 它们 都 初始 化 为 None。 数 据 节点 〈 详 见 代 码 清 单 8-13 ) 有 4 
个 字段 一 一 键 、 值 以 及 next 和 down 两 个 引用 。 同 样 ， 将 引用 初始 化 为 None， 并 提供 get 方法 
和 set 方 法 操作 市 点 。 


代码 清单 8-12 HeadqerNode 类 














1 class HeaderNode: 

2 def _ init_ _ (self) : 

3 self.next = None 

4 self.down = None 

5 

6 def getNext (self): 

a return self.next 

8 

9 def getDown (self): 

10 return self.down 

J 入 

泛 def setNext (self, newnext): 
13 self.next = newnext 

14 

15 def setDown(self, newdown): 
G6 self.down = newdown 





代码 清单 8-13 DataNode 类 





由 class DataNode: 

六 def _ init_ _(self, key, value): 
3 self.key = key 

4 self.data = value 

3 self.next = None 
6 
7 
8 
9 


1 


self.down = None 








def getKkey (self): 
return self.key 

10 
1 def getDatal(self): 
二 用 return self.data 
13 
14 def getNext (self): 
15 return self.next 
16 
17 def getDown (self): 
18 return self.down 
19 
20 def setDatal(lself, newdata): 
之 下 self.data = newdata 
22 
23 def setNext (self, newnext): 
24 self.next = newnext 
25 
26 def setDown(self, newdown): 
2 self.down = newdown 
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代码 清单 8-14 给 出 了 跳 表 的 构造 方法 。 刚 创建 时 ， 跳 表 没 有 数据 ， 所 以 没有 头 节 点 ， 表 头 
被 设 为 None。 随 着 键 - 值 对 的 加 入 ， 表 头 指 向 第 一 个 头 节点 。 通 过 这 个 头 节点 ， 既 可 以 访问 数据 
节点 链表 ， 也 可 以 访问 更 低 的 层 。 








代码 清单 8-14 SkipList 类 的 构造 方法 


| class SkipList: 
2 def,. “Tnit (SeLE)s 
3 self.head = None 








1. 搜索 跳 表 


跳 表 的 搜索 操作 需要 一 个 键 。 它 会 找到 包含 这 个 键 的 数据 节点 ， 并 返回 对 应 的 值 。 图 8-11 
展示 了 搜索 键 77 的 过 程 ， 星 星 表示 搜索 过 程 要 查找 的 节点 。 

















图 8-11 搜索 键 77 








我 们 从 表 头 开始 搜索 77。 第 一 个 头 节点 指向 存储 31 的 数据 节点 。 因 为 31 小 于 77, 所 以 向 
前 移动 。 含 31 的 数据 节点 位 于 第 3 层 , 它 没 有 下 一 个 节点 ,所 以 必须 下 降 到 第 2 层 。 在 这 一 层 ， 
我 们 发 现 了 键 为 77 的 数据 节点 。 搜 索 成 功 , 返回 单词 of。 注意 , 搜索 过 程 “ 跳 过 ”了 17 和 26。 
同 理 ， 可 以 忽略 54， 从 31 直接 跳 到 77。 


代码 清单 8-15 给 出 了 search 方法 的 Python 实现 。 搜 索 从 表 头 开始 , 直到 找到 键 ， 或 者 检查 完 
所 有 的 数据 节点 。 第 3 行 和 第 4 行 的 变量 founda 和 stop 用 于 控制 条 件 。 搜 索 的 基本 思路 是 从 顶层 
的 头 节 点 开始 往 右 查找 。 如 果 没 有 数据 节点 ， 就 下 降 一 层 (第 9 行 和 第 10 行 ); 如 果 有 数据 节点 ， 
就 比较 键 的 大 小 。 如 果 匹 配 ， 就 说 明 搜索 成 功 ， 可 以 将 foung 置 为 True (第 12 行 和 第 13 行 )。 
代码 清单 8-15 ”search 方法 


1 def searchl(self, key): 
current = self.head 
found = False 

stop = False 


























本 中 DD 
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Ss while not foungd andq not stop: 

6 if current == None: 

7 stop = True 

8 else: 

9 if current .getNext () == None: 

10 current = current .getDown() 

村 else: 

2 if current .getNext () .getKey () == key: 
13 found = True 

14 else: 

15 if key < current .getNext () .getKey () : 
15 current = current .getDown() 
7 else: 

18 current = current .getNext() 
19 if found: 

2 return current .getNext () .getData() 

21 else: 

入 return None 











因为 每 一 层 是 一 个 有 序 链表 ,所 以 不 匹配 的 键 提供 了 很 用 的 信息 。 如 果 要 找 的 键 小 于 数据 
节点 中 的 键 (第 15 行 ), 就 说 明 这 一 层 不 会 有 包含 目标 键 的 数据 节点 ， 因 为 往 右 的 所 有 节点 只 会 
更 大 。 这 时 ， 就 需要 下 降 一 层 (第 16 行 )。 如 果 已 经 降 至 底层 (None ), 说 明 跳 表 中 没有 要 找 的 
键 ， 于 是 将 变量 stop 置 为 True。 男 一 方面 ， 只 要 当前 层 的 节点 有 比 目 标 键 更 小 的 键 ， 就 往 下 
一 个 节点 移动 (第 18 行 )。 

进入 下 一 层 后, 重复 上 述 过 程 ， 检 查 是 否 有 下 一 个 节点 。 每 降 一 层 ， 跳 表 就 可 以 提供 更 多 的 
数据 节点 。 如 果 目 标 键 在 跳 表 中 ， 不 会 到 了 第 0 层 还 不 出 现 ， 因 为 第 0 层 是 完整 的 有 序 链 表 。 我 
们 和 希望 通过 跳 表 尽早 地 找到 目标 键 。 

2. 往 跳 表 中 加 入 键 - 值 对 

在 已 有 跳 表 的 情况 下 ，search 方法 实现 起 来 相对 简单 。 本 节 的 任务 是 理解 如 何 构建 跳 表 ， 
以 及 为 何以 相同 的 顺序 插入 同一 组 键 会 得 到 不 同 的 跳 表 。 

要 往 跳 表 中 新 添 键 - 值 对 ， 本 质 上 需要 两 步 。 第 一 步 ， 搜 索 跳 表 ， 寻 找 搬 和 人 位置。 记 住 ， 我 
们 假设 跳 表 中 还 没有 待 插入 的 键 。 图 8-12 展示 了 试图 加 入 键 65 的 过 程 ( 值 是 hi )。 我 们 再 次 使 
用 星星 展示 搜索 过 程 。 
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图 8-12 ”搜索 键 65 


使 用 和 前 一 节 一 样 的 搜索 策略 ， 我 们 发 现 65 比 31 大 。 第 3 层 没 有 更 多 的 节点 ， 因 此 降 至 
第 2 层 。 在 这 一 层 , 我 们 发 现 77 比 65 大。 继续 降 至 第 1 层 ， 下 一 个 节点 是 54， 它 小 于 65。 继 
续 向 右 ， 遇 到 Fs 再 往 下 转 ， 遇 到 Noneo。o 


第 二 步 是 新 建 一 个 数据 节点 ， 并 将 它 加 到 第 0 层 的 链表 中 ， 如 图 8-13 所 示 。 然 而 ， 如 果 止 
步 于 此 ， 最 多 只 能 得 到 一 个 键 - 值 对 链表 。 我 们 还 需要 为 新 的 数据 节点 构建 塔 ， 这 就 是 跳 表 的 有 
趣 之 处 。 塔 应 该 多 高 ”新 数据 节点 的 塔 高 并 不 是 确定 的 ， 而 是 完全 随机 的 。 本 质 上 , 通过 “ 抛 硬 
币 ” 来 决定 是 否 要 往 塔 中 加 一 层 。 如 果 得 到 正面 ， 就 往 当 前 的 塔 中 加 一 层 。 



























































表 头 塔 的 高 度 ? 
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图 8-13 为 65 构建 数据 节点 和 塔 


利用 随机 数 生 成 器 可 以 方便 地 模拟 抛 硬 币 ,代码 清单 8-16 使 用 random 模块 中 的 randrange 
函数 ， 返 回 0 或 1。 如 果 flip 返回 1， 我们 就 认为 得 到 硬币 的 正面 。 
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代码 清单 8-16 ”模拟 抛 硬 币 





J from random import randrange 
六 def flip() : 
号 return randrange (2) 




















代码 清单 8-17 是 insert 方法 的 第 一 部 分 。 显 然 ， 
个 数据 节点 。 在 构建 简单 的 链表 时 ， 也 考虑 过 这 个 问题 
点 和 数据 节点 。 第 7~14 行 重复 循环 ， 直 到 flip 方法 返回 1 (和 
都 创建 一 个 数据 节点 和 一 个 头 节点 所 


代码 清单 8-17 insert 方法 的 第 一 部 分 

















第 2 行 是 在 检查 是 否 要 为 跳 表 添加 第 一 
。 如 果 要 在 表 头 添加 节点 ， 必 须 新 建 头 节 





号 到 硬币 的 正面 )。 每 新 加 一 层 ， 





4 def insert (self, key, data): 

之 if self.head == None: 

3 self.head = HeaderNode() 

4 temp = DataNode (key, data) 

5S self.head.setNext (temp) 

6 top = temp 

7 while fl1ip() = 13 

8 newhead = HeaderNode() 

9 temp = DataNode (key, data) 
10 temp.setDown (top) 

11 newhead.setNext (temp) 

业 色 newhead.setDown (self.head) 
13 self.head = newhead 

14 top = temp 

下 5 else: 











如 前 所 述 ， 对 于 非 空 跳 表 ( 代码 清单 8-18 )， 需 要 搜索 插 和 人 位置 。 由 于 没 法 知道 塔 中 会 有 多 
少 个 数据 节点 ， 因 此 需要 为 每 一 层 都 保存 插 人 点 。 因 为 这 些 插入 点 会 按 逆序 处 理 ， 所 以 栈 可 以 很 





好 地 帮助 我 们 按照 
们 只 表示 在 搜索 过 程 中 降 至 下 一 层 的 地 方 。 


代码 清单 8-18 insert 方法 的 第 二 部 分 

















:与 插入 节点 相反 的 顺序 遍历 链表 。 图 8-13 中 的 星星 标 出 了 栈 中 的 插入 点 ， 它 








> key: 


1 towerStack = Stack() 

2 current = self.head 

3 stop = False 

4 while not stop: 

5 if current == None: 

6 stop = True 

7 else: 

8 if current .getNext () == None: 

9 towerStack.push (current) 

10 current = current .getDown() 
11 else: 

下 这 if _ current .getNext () .GetKey () 
ge towerStack.push (current) 
14 current = current .getDown() 
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3 else: 

16 Current = current .getNext () 
17 

18 lowestLevel = towerStack.pop() 

19 temp = DataNode (key, data) 

20 temp.setNext (lowestLevel .getNext () ) 

21 lowestLevel .setNext (temp) 

22 top = temp 





在 代码 清单 8-19 中 ， 我们 通过 抛 硬币 决定 塔 的 层 数 。 从 插入 栈 弹出 下 一 个 插入 点 。 只 有 当 
栈 为 空 之 后 ， 才 需要 返回 并 新 建 头 节点 。 这 些 细节 和 贸 给 你 自行 研究 。 


代码 清单 8-19 insert 方法 的 第 三 部 分 











1 while flip() == 

2 if towerStack.isEmpty(): 
newhead = HeaderNode() 

4 temp = DataNode (key, data) 

3 temp.setDown (top) 

6 newhead.setNext (temp) 

7 newhead.setDown (self.head) 

8 self.head = newhead 

9 top = temp 

10 else: 

于 nextLevel = towerStack.pop() 
于 2 temp = DataNode (key, data) 

了 | temp.setDown (top) 

14 temp.setNext (nextLevel .getNext ()) 
5 nextLevel .setNext (temp) 

16 top = temp 








关于 跳 表 的 结构 ， 还 有 一 点 需要 注意 。 之 前 提 过 ， 即 使 以 相同 的 顺序 插入 同一 组 键 , 也 可 能 
得 到 不 同 的 跳 表 。 你 现在 应 该 已 经 知道 原因 了 。 根据 抛 硬币 的 随机 本 质 , 任意 键 的 塔 高 在 每 次 构 
建 跳 表 时 都 会 改变 。 

3. 构建 映射 

至 此 , 我 们 实现 了 向 跳 表 中 添加 数据 的 操作 ,并 且 能 够 搜索 数据 。 现 在 , 终于 可 以 实现 映射 
抽象 数据 类 型 了 。 如 前 所 述 ， 映 射 支持 两 个 操作 一 一 put 和 get。 代 码 清单 8-20 表明 ， 可 以 轻 
松 实现 这 两 个 操作 ， 做 法 是 构建 一 个 内 部 跳 表 (第 3 行 )， 并 利用 已 经 实现 的 insert 方法 和 
search 方法 。 


代码 清单 8-20 ”用 跳 表 实现 Map 类 
































class Map : 
def _ init _(self): 
self.collection = SkipList() 


def put (self, key, value): 


1 
2 
3 
4 
3 
6 self.collection.insert (key, value) 
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8 def get (self, key): 
9 return self.collection.search (key) 
4. 分 析 跳 表 



































如 果 简 单 地 用 一 个 有 序 链表 存储 键 - 值 对 ， 那么 搜索 方法 的 时 间 复 杂 度 将 是 O(n) 。 跳 表 是 否 
会 有 更 好 的 性 能 呢 ? 你 应 该 记得 , 跳 表 是 基于 概率 的 数据 结构 , 这 意味 着 其 性 能 基于 某 些 事件 的 

















概率 一 一 本 例 中 的 事件 就 是 抛 硬 币 。 虽然 详细 的 分 析 超 出 了 本 书 范围 , 但 我 们 可 以 给 出 一 个 不 太 
正式 的 有 力 论 证 。 


假设 要 为 n 个 键 构建 跳 表 。 我 们 知道 ， 每 座 塔 的 高 度 从 1 开始 。 在 添加 数据 节点 时 ,假设 抛 
出 “正面 " 的 概率 是 ,我 们 可 以 说 有 2 个 刍 的 高 度 是 2。 青 折 次 硬币 ， 有 二 个 键 的 高 度 是 3， 



























































对 应 连续 抛 出 两 次 正面 的 概率 。 同 理 ， 有 号 个 键 的 高 度 是 4， 依 此 类 推 。 这 意味 着 塔 的 最 大 高 度 
是 log, n+1。 使 用 大 O 记 法 ， 可 以 说 跳 表 的 高 度 是 O(logn) 。 


给 定 一 个 键 , 在 查找 时 要 扫描 两 个 方向 。 第 一 个 方向 是 向 下 。 前 面 的 结果 表明 ， 在 最 坏 情况 
下 ， 找 到 目标 键 要 查找 O(logn) 层 。 第 二 个 方向 是 沿 着 每 一 层 向 前 扫描 。 每 当 遇 到 以 下 两 种 情况 
之 一 时 , 就 下 降 一 层 : 要 么 数据 节点 的 刍 比 目标 键 大 , 要 么 抵达 这 一 层 的 终点 。 对 于 下 一 个 节点 ， 


发 生 上 述 两 种 情况 之 一 的 概率 是 了 。 这 意味 着 查看 2 个 链接 后 ,就 会 下 降 一 层 ( 抛 两 次 硬币 后 得 


到 正面 )。 无 论 哪 种 情况 ， 在 任 一 层 需 要 查看 的 节点 数 都 是 常数 。 因 此 ， 搜 索 操 作 的 时 间 复 杂 度 
是 O(logn) 。 因 为 插入 操作 的 大 部 分 时 间 花 在 查找 插入 位 置 上 ， 所 以 插入 操作 的 时 间 复 杂 度 也 是 
O(logn) 。 


8.5 复习 树 : 量化 图 片 


图 片 是 互联 网 上 十 分 常见 的 元 素 , 其 常见 程度 仅 次 于 文字 。 不 过 ， 如 果 每 张 广 告 图 片 都 占据 
196 560 字 节 ， 那 么 互联 网 会 慢 很 多 。 实 际 上 ， 横幅 广告 图 片 只 需 约 14 246 字 节 ， 即 原 存储 空间 
的 7.2%。 这 些 数 字 从 何 而 来 ”怎么 才能 如 此 显著 地 节省 空间 ?答案 就 在 本 节 中 。 

























































































8.5.1 数字 图 像 概 述 


一 幅 数 字 图 像 由 数 以 千 计 的 像素 组 成 。 像 素 排 列 成 矩阵 ， 形 成 图 像 。 图 像 中 的 每 个 像素 代表 
一 个 特定 的 颜色 ， 由 三 原色 混合 而 成 : 红 、 绿 、 蓝 。 图 8-14 简单 地 展示 了 像素 如 何 排 列 成 图 像 。 
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图 8-14 简单 的 图 


在 物理 世界 中 , 不 同 颜色 之 间 的 过 渡 是 连续 的 。 就 像 利 用 浮 点 数 近 似 表示 实数 一 样 ， 计 算 机 
也 必须 近似 表示 图 像 中 的 颜色 。 对 于 每 种 三 原色 ， 人 有 眼 可 以 区 分 200 种 不 同 的 层次 ， 总 共 约 800 
万 种 颜色 。 在 实践 中 ， 我 们 使 用 1 字 节 (8 位 ) 表示 像素 的 每 个 颜色 构成 。8 位 可 以 表示 每 种 三 
原色 的 256 种 层次 ， 所 以 每 个 像素 可 能 有 约 1670 万 种 颜色 。 海 量 的 颜色 选择 有 助 于 艺术 家 和 设 
计 师 创造 出 细节 丰富 的 图 片 , 但 也 有 坏处 , 那 就 是 图 片 文件 的 大 小 会 迅速 膨胀 。 举 例 来 说 ， 一 张 
由 百 万 像素 相机 拍 出 来 的 照片 ， 会 占据 3 兆 字 节 的 内 存 空间 。 
Python 使 用 元 组 列表 来 表示 图 片 , 元 组 由 3 个 取 值 范围 是 0~255 的 数字 构成 , 它们 分 别 代表 
红 、 绿 、 蓝 。 在 C++ 和 Java 等 语言 中 ， 图 片 表示 为 二 维 数组 。 以 图 8-14 为 例 ， 该 图 的 头 两 行 表 
示 如 下 : 


I s. LL(255, D35255) .235 255,. 255) (2557 2 255) 7 (L278 2335)» (12 287 255)> 


(255% 3502555); (255;),. 255% 25955) (295 23555 DID)]a [L(255, 259557 205): (22557 :255 295)5 
(直人 WO OO) (2 OD 2D5) (20D 233 2535), “(L228 255) (255.7 25D 0) yr (205 
959. SHY 


:S| 


白色 表示 为 (255, 255, 255)， 蓝 色 表 示 为 (12, 28, 255)。 使 用 列表 索引 可 以 查看 图 片 中 任 一 像 
素 的 颜色 ， 如 下 所 示 : 


> [3 [2:] 
(05 789 





有 了 这 种 图 片 表 示 方 法 , 就 不 难 将 图 片 存 为 文件 只 需 为 每 个 像素 写 一 个 元 组 即 可 。 可 以 
先 确定 像素 的 行 数 和 列 数 ， 然 后 每 行 写 3 个 整数 。 实 践 中 ，PIL (Python Image Library ) 提供 了 
更 强大 的 图 片 类 。 我 们 可 以 通过 getPixel((co1l，row)) 和 setPixel((col, row)， 
colorTuple) 读 取 和 设置 像素 。 注 意 ， 参 数 对 应 的 是 坐标 ， 而 不 是 行 数 和 列 数 。 



































8.5.2 量化 图 卢 
有 很 多 方法 可 以 节省 图 片 的 存储 空间 ， 最 简单 的 就 是 减少 所 用 颜色 的 种 类 。 颜 色 越 少 ， 红 
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绿 、 蓝 的 位 数 就 越 少 ， 所 需 的 存储 空间 也 将 随 之 减少 。 实 际 上 ,最 流行 的 一 种 用 于 互联 网 的 图 片 
格式 只 使 用 了 256 种 颜色 。 这 意味 着 将 所 需 的 存储 空间 从 每 像素 3 字 节 降 到 了 每 像素 1 字 节 。 

你 可 能 会 问 ， 如 何 将 颜色 从 1670 万 种 降 到 256 种 呢 ? 答案 就 是 量化 。 要 理解 量化 ， 我 们 将 
颜色 想象 成 一 个 三 维 空间 。x 轴 代 表 红 色 , y 轴 代 表 绿 色 ，z 轴 则 代表 蓝 色 。 每 种 颜色 都 可 以 看 作 
这 个 空间 中 的 一 个 点 。 我 们 将 由 所 有 颜色 构成 的 空间 想象 成 一 个 256x256x256 的 立方 体 。 越 靠 
近 (0, 0, 0) 处 ， 颜 色 越 黑 、 越 暗 ; 越 靠近 (25$, 255, 255) 处 ， 颜 色 则 越 白 、 越 亮 ; 靠近 (255, 0, 0) 处 
的 颜色 偏 红 ， 依 此 类 推 。 

最 简单 的 量化 过 程 是 将 256x256x256 的 立方 体 转 化 成 8x8x8 的 立方 体 。 虽 然 体 积 不 变 , 但 
原 立 方 体 中 的 多 种 颜色 在 新 立方 体 中 成 了 一 种 ， 如 图 8-15 所 示 。 








(255.255.255) (7D 


(255.0.0) 





(7.0.0) 





图 8-15 ”颜色 量化 


可 以 用 Python 实现 上 述 颜色 量化 算法 , 如 代码 清单 8-21 所 示 。simpleouant 将 每 个 像素 的 
256 位 表示 的 颜色 映射 到 像素 中 心 处 的 颜色 。 这 一 步 使 用 Python 的 整除 很 容易 做 到 。 在 
simpleQuant 中 ， 红 色 维 度 上 有 7 个 值 ， 绿 色 和 蓝 色 维度 上 有 6 个 值 。 


代码 清单 8-21 简单 的 图 片 量化 算法 








1 import sys 

分 import os 

3 import Image 

4 def simpleQuant () : 

5 im = Image.open('bubbles.jpg') 
6 wh = im.size 

7 for row in range(h): 

8 for col in range(w): 

9 r,g,b = im.getpixel( (col, row)) 
10 6 

11 g=9g// 42* 42 

二 多 .SB 2 2 


相交 im.putpixel((col, row), (r, g, b)) 
14 im.show!() 
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图 8-16 是 量化 前 后 的 对 比 效果 。 当 然 ， 这 些 图 在 印刷 版 中 变 成 了 灰 度 图 。 如 果 看 彩 图 ， 会 
发 现 量化 后 的 图 片 损失 了 不 少 细节 ”"。 草 地 几乎 损失 了 所 有 细节 ， 只 是 一 片 绿 ， 人 的 肤色 也 简化 
成 了 两 片 标 色 阴影 。 








(a) 量化 前 (b) 量化 后 
图 8-16 使 用 简单 的 图 片 量 化 算法 的 前 后 对 比 效果 


8.5.3 ”使 用 八 叉 树 改进 量化 算法 


simpleouant 的 问题 在 于 ， 大 部 分 图 片 中 的 颜色 不 是 均匀 分 布 的 。 很 多 颜色 可 能 没有 出 现 
在 图 片 中 , 所 以 立方 体 中 对 应 的 部 分 并 没有 用 到 。 在 量化 后 的 图 片 中 分 配 没 用 到 的 颜色 是 浪费 行 
为 。 图 8-17 展示 了 示例 图 片 中 的 颜色 分 布 。 注 意 ， 只 用 了 立方 体 的 一 小 部 分 空间 。 


























图 8-17 示例 图 片 用 到 的 颜色 











为 了 更 好 地 量化 图 片 ， 就 要 找到 更 好 的 方法 ， 选 出 表示 图 片 时 用 到 的 颜色 集合 。 有 多 种 算法 
可 用 于 切 分 立方 体 ， 以 更 好 地 使 用 颜色 。 本 闻 将 介绍 基于 八 叉 树 的 算法 。 八 又 树 类 似 于 二 又 树 ， 








车 想 下 载 彩 图 ， 请 访问 图 灵 社 区 并 单 击 “ 随 书 下 载 "，http://www.ituring.com.cn/book/2482。 一 一 编者 注 
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但 每 个 节点 有 8 个 子 节点 。 下 面 是 octTree 抽象 数据 类 型 将 实现 的 接口 。 
口 0ctTree () 新 建 一 棵 空 的 八 又 树 。 
口 ijnsert (r，g，b) 往 八 又 树 中 插入 一 个 节点 ， 以 红 、 绿 、 蓝 的 值 为 键 。 
口 find(r,，g，b) 以 红 、 绿 、 蓝 的 值 为 搜索 键 ， 查找 一 个 节点 ,或 与 其 最 相似 的 节点 。 
口 reduce (n) 缩 小 八 义 树 ， 使 其 及 个 或 更 少 的 叶子 节点 。 
OctTree 通过 如 下 方式 切 分 颜色 立方 体 。 
口 octTree 的 根 代 表 整 个 立方 体 。 
D octTree 的 第 二 层 代 表 每 个 维度 包括 x 轴 、y 轴 和 z 轴 ) 上 的 一 个 切片 ， 将 立方 体 等 分 成 8 块 。 
口 下 一 层 将 8 个 子 块 中 的 每 一 块 再 等 分 成 8 块 ， 即 共有 64 块 。 注 意 ， 父 节点 代表 的 方块 包 
含 其 子 节点 代表 的 所 有 子 块 。 沿 着 路 径 往 下 ， 子 块 始终 位 于 父 节点 所 规定 的 界限 内 ,但 
会 越 来 越 具 体 。 
口 八 又 树 的 第 8 层 代 表 所 有 颜色 〈 约 有 1670 万 种 ) 。 
了 解 如 何 用 八 又 树 表示 颜色 立方 体 之 后 , 你 可 能 认为 这 不 过 又 是 一 种 等 分 立方 体 的 方法 。 没 
错 , 不 过 八 叉 树 是 分 级 的 , 我们 可 以 利用 其 层级 ， 用 大 立方 体 表 示 未 使 用 的 颜色 ,用 小 立方 体 表 
示 常 用 颜色 。 以 下 大 致 介绍 如 何 使 用 octTree 更 好 地 选择 图 片 的 颜色 子 集 。 
(1) 针对 图 片 中 的 每 个 像素 ， 执 行 以 下 操作 : 
(a) 在 OctTree 中 查找 该 像素 的 颜色 ， 这 个 颜色 应 该 是 位 于 第 8 层 的 一 个 叶子 节点 ; 
(b) 如 果 没 找到 ,就 在 第 8 层 创建 一 个 叶子 节点 (可 能 还 需要 在 叶子 节点 之 上 创建 一 些 内 部 节 
点 
(c) 如 果 找 到 了 ， 将 叶子 节点 中 的 计数 器 加 1， 以 记录 这 个 颜色 用 于 多 少 个 像素 。 
(2) 重复 以 下 步 又 ， 直 到 叶子 节点 的 数目 小 于 或 等 于 颜色 的 目标 数目 : 
(a) 找到 用 得 最 少 的 叶子 节点 ; 
(b) 合并 该 叶子 节点 及 其 所 有 兄弟 节点 ， 从 而 形成 一 个 新 的 叶子 节点 。 
(3) 剩余 的 叶子 节点 形成 图 片 的 颜色 集 。 
(4) 知 要 将 初始 的 颜色 映射 为 量化 后 的 值 ， 只 需 沿 着 树 向 下 搜索 到 叶子 节点 ， 然 后 返回 叶子 
节点 存储 的 颜色 值 。 
可 以 将 上 述 思路 实现 为 Python 函数 puilgangDisplay ()， 以 读 取 、 量 化 和 展示 图 片 ， 如 
代码 清单 8-22 所 示 。 
代码 清单 8-22 使 用 八 又 树 构建 和 展示 量化 后 的 图 片 
J def buildAndDisplay(): 
im = Image.open('bubbles.jpg') 
3 wh = im.size 


ot = OctTree!() 
for row in range(0, h): 
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for col in range(0, w): 
r,g,b = im.getpixel((col, row)) 
ot inesertl(r, gi Bb) 


‘Om 


ot.reduce(256) # 减 为 256 种 颜色 


for row in range(0, h): 
for col in range(0, w): 
r,g,b = im.getpixel((col, row)) 
oh at ete Po oN 0) oy hts Mh eee Pl 
im.putpixel((col，row)，(nr，ng，nb)) # 用 量化 后 的 新 值 替换 像素 


co am 性 wm 口 





im. show() 





这 个 函数 遵循 了 前 面 描述 的 基本 步骤 。 首 先 , 第 5~8 行 的 循环 读 取 每 个 像素 ,并 将 其 加 到 八 
叉 树 中 。 第 8 行 往 八 又 树 中 插入 像素 。 减 少 叶 子 节 点 的 工作 由 第 10 行 的 reduce 方法 完成 。 第 
15 行 使 用 fing 方法 ， 在 缩小 后 的 八 又 树 中 搜索 颜色 ， 并 更 新 图 片 。 

本 例 使 用 了 PIL 库 中 的 4 个 简单 函数 : Image.open 打开 已 有 的 图 片 文件 ，getpixel 读 取 
像素 ，putpixel 写 人 像素 ，shovw 在 屏幕 上 展示 结果 。 

现在 来 看 看 octTree 类 及 其 关键 方法 。 请 注意 ， 这 里 其 实 有 两 个 类 。octTree 类 用 于 
buildqanqDisplay 函数 ,但 其 实 只 是 用 了 它 的 一 个 实例 。 第 二 个 类 是 octTree 类 内 部 定义 的 
otNode。 这 种 定义 于 男 一 个 类 内 部 的 类 称 作 内 部 类 。 之 所 以 在 octTree 类 的 内 部 定义 otNode， 
是 因为 0ctTree 的 每 个 节点 都 需要 访问 一 些 存 储 于 octTree 类 实例 中 的 信息 。 还 有 一 个 原因 是 ， 
没有 任何 在 octTree 类 之 外 使 用 otNode 的 必要 。otNode 是 octTree 私有 的 ， 别 人 不 需要 了 
解 它 的 实现 细节 。 这 是 软件 工程 中 的 良好 实践 ， 称 作 “ 信 息 隐 藏 ”。 

builgAngDi splay 用 到 的 所 有 函数 都 在 octTree 类 中 定义 。 代码 清 单 8-23~ 代 码 清单 8-27 
展示 了 octTree 类 的 实现 。 注意 , 构造 方法 首先 将 根 节 点 初始 化 为 None, 然后 设置 了 所 有 市 点 
都 可 能 访问 的 3 个 重要 属性 : maxLevel 、numLeaves 和 leafList。maxLevel 属性 限制 了 树 
的 总 体 深度 ， 本 例 将 它 初 始 化 为 $S。 我 们 仅 略 微 改 进 量化 算法 ， 以 忽略 颜色 信息 中 的 两 个 最 低 有 
效 位 。 即 便 如 此 ， 也 能 让 树 总 体 上 小 得 多 ， 并 且 也 不 会 降低 最 终 图 片 的 质量 。numLeaves 和 
leafList 记录 叶子 节点 的 数目 ， 从 而 使 我 们 能 直接 访问 叶子 节点 ， 而 不 用 沿 着 树 遍历 。 你 很 快 
就 能 看 到 这 样 做 的 重要 性 。 


代码 清单 8-23 ”octTree 类 


class OctTree: 

def _ init (self): 
self.root = None 
self.maxLevel = 5 
self.numLeaves = 0 
self.leafList = [] 





































































































def insert (self, r, g, b): 
if not self.root: 
0 self.root = self.otNode(outer=self) 


卢 \ov~ RAODODP 
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1 self.root.insert(r, g, b, 0, self) 

六 

二 六 def find(self, r, g, b): 

14 if self.root: 

下 区 return self.root.find(r, g, b, 0) 
16 

2 def reduce(self, maxCubes): 

18 while len(self.leafList) > maxCubes: 

19 smallest = self.findMinCube() 

20 smallest .parent .merge() 

22 self.leafList.append(smallest .parent) 
22 self.numLeaves = self.numLeaves + 1 
23 

24 def findMinCube (self): 

25 minCount = sys.maxint 

26 maxLev = 0 

2 minCube = None 

28 for i in self.leafList: 

29 if i.count <= minCount and i.level >= maxLeyv: 
30 minCube = i 

3 minCount = i.count 

32 maxLev = i.level 

33 return minCube 




















八 义 树 的 insert 方法 和 find 方法 与 第 6 章 中 的 类 似 。 先 检查 根 节点 是 否 存在 ， 然 后 调用 
根 节 点 相应 的 方法 。 注 意 ， 这 两 个 方法 都 使 用 红 、 绿 、 蓝 标识 树 中 的 节点 。 

在 代码 清单 8-23 中 ,第 17 行 定义 reduce 方法 。 这 个 方法 一 直 循环 ， 直 到 叶子 列表 中 的 节 
点 数目 小 于 在 最 终 图 片 中 要 保留 的 颜色 总 数 ( 由 参数 maxcubes 定义 )。reduce 使 用 辅助 函数 
fingdMinCube 找到 octTree 中 引用 数 最 少 的 节点 , 然后 将 该 节点 与 其 所 有 的 兄弟 节点 合并 成 一 
个 节点 (参见 第 20 行 ) findMincube 方法 通过 leafList 和 一 个 查找 最 小 值 的 循环 模式 实现 。 
当 叶 子 节 点 很 多 时 一 一 可 以 达到 1670 万 个 一 一 这 种 做 法 的 效率 极 低 。 在 章 末 的 练习 中 ， 你 需要 
修改 octTree， 以 提升 findqMincube 的 效率 。 

现在 来 看 octTree 中 节点 的 类 定义 ， 如 代码 清单 8-24 所 示 。otNoade 类 的 构造 方法 有 3 个 
可 选 参 数 。 参 数 让 octTree 方法 可 以 在 多 种 环境 下 构造 新 节点 。 和 在 二 又 搜索 树 中 一 样 ， 我 们 
显 式 记 录 节 点 的 父 节 点 。 节 点 的 层 数 表明 它 在 树 中 的 深度 。 在 这 3 个 参数 中 ， 最 有 趣 的 就 是 
outer， 这 是 指向 创建 这 个 节点 的 octTree 实例 的 引用 。 和 self 一 样 ，outer 允许 otNode 
实例 访问 octTree 实例 的 属性 。 

关于 octTree 中 的 每 个 节点 , 我 们 要 记 住 的 其 他 属性 包括 引用 计数 count 和 红 、 绿 、 蓝 等 
颜色 构成 。 在 insert 方法 中 ， 只 有 叶子 节点 有 red、green、pblue 和 count 的 值 。 并 且 ， 
个 节点 最 多 可 以 有 8 个 子 节 点 ， 所 以 我 们 初始 化 一 个 有 8 个 引用 的 列表 ， 以 记录 它们 。 二 叉 树 只 
有 左右 两 个 子 节 点 ， 八 又 树 则 有 8 个 子 节点 ， 编 号 分 别 为 0~7。 


代码 清单 8-24 ”otNode 类 及 其 构造 方法 


class otNode: 
2 def __init_ _(self, parent=None, level=0, outer=None): 
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3 self.red = 0 

4 self.green = 0 

5 self.blue = 0 

6 self.count = 0 

7 self.parent = parent 

8 self.level = level 

9 self.oTree = outer 

10 self.children = [None ]*8 





现在 来 看 octTree 中 真正 有 趣 的 部 分 .代码 清单 8-25 是 往 octTree 中 插入 新 节点 的 Python 
代码 。 要 解决 的 第 一 个 问题 是 如 何 找 出 新 节点 在 树 中 的 位 置 。 二叉树 中 的 规则 是 , 键 比 父 节 点 小 
的 节点 都 在 左 子 树 ， 键 比 父 节点 大 的 都 在 右 子 树 。 但 如 果 每 个 节点 都 有 8 个 子 节点 ， 就 没 这 么 简 
单 了 。 另 外 ,在 处 理 颜 色 时 ， 不 容易 说 清楚 每 个 节点 的 键 该 是 什么 。octTree 使 用 三 原色 组 成 
的 信息 。 图 8-18 展示 了 如 何 使 用 红 、 绿 、 蓝 的 值 计算 新 节点 在 每 一 层 的 位 置 ， 相 应 的 代码 在 代 
码 清单 8-25 中 的 第 18 行 。 



























































红 1 0 1 0 0 0 1 1 163 
绿 0 1 1 0 0 0 1 0 98 
蓝 l 1 1 0 0 1 l 1 231 



































red 0 green: 0 blue: 0 
红 绿 蓝 层 索 引 count: 


0 
0|1|2|3|14|15|6|7 
1 0 1 5 


red: 0 green: 0 blue: 0 
0 1 1 3 count: 0 


0|1|2|3|14|5|6|7 
1 1 1 7 


red: 0 green: 0 blue: 0 
0 0 0 0 count: 0 


0|1112|131413S16|17 


red: 0 green: 0 blue: 0 
count: 0 


[0111213141516|7| 
red: 163 green: 98 blue: 231 
count: 1 


ol1121314| [6[7| 
图 8-18 计算 插入 节 点 的 位 置 
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代码 清单 8-25 ”insert 方法 





下 def insert (self, r, g, b, level, outer): 

冯 if level < self.oTree.maxLevel: 

3 idx = self.computeIndex(r, g, b, level) 

4 if self.children[idx] == None: 

5 self.children[idx] = outer.otNode (parent=self, 
6 level=level+l, 
7 outer=outer) 

8 self.children[idx].insert(r, g, b, level+l1l, outer) 
9 else: 

10 if self.count == 

于 卫 self.oTree.numLeaves = self.oTree.numLeaves + 1 
12 self.oTree.leafList.append(self) 

13 self.red += r 

14 self.green += 9 

15 self.blue += b 

16 self.count = self.count + 1 

ga 

18 def computeIndex(self, r, g, b, level): 

19 shift = 8 - level 





20 re ="T SS> Shift 2 & 0xX4 
2 gc = 9g >> shift -1 & 0x2 
22 be = b>> shift & Oxl 

23 return(rc | gc | bc) 





插入 位 置 的 计算 结合 了 红 、 绿 、 蓝 成 分 的 信息 ， 从 树 根 出 发 ， 以 最 高 有 效 位 开始 。 图 8-18 
给 出 了 红 (163 )、 绿 (98 )、 蓝 (231 ) 各 自 的 二 进 制 表示 。 从 每 个 颜色 的 最 高 有 效 位 开始 ， 本 例 
中 分 别 是 1、0 和 1， 放 在 一 起 得 到 二 进 制 数 101， 对 应 十 进 制 数 5。 在 代码 清单 8-25 中 , 第 18 
行 的 computeIndex 方法 进行 了 这 样 的 二 进 制 操 作 。 

你 可 能 不 熟悉 computeIndex 使 用 的 运算 符 。>> 是 右 移 操作 ，&g 是 位 运算 中 的 ang，| 则 是 
es or。 位 运算 和 条 件 判 断 中 的 逻辑 运算 一 样 ， 只 不 过 它们 操作 的 对 象 是 数字 的 位 。 移 
动 操作 将 比特 向 右 移动 位 ， 左 边 用 0 填充， 右边 超出 的 部 分 直接 舍 去 。 


计算 出 当前 层 的 索引 后 ， 进 入 子 树 。 在 图 8-18 的 例子 中 ， 我们 循 着 chi laren 数组 第 5 个 
位 置 上 的 链接 往 下 。 如 果 位 置 5 没有 节点 ， 就 新 建 一 个 。 往 下 遍历 ,直到 抵达 maxLevel 层 。 在 
这 一 层 停 止 搜索 ,存储 数据 。 注 意 ,不 是 覆盖 叶子 节点 中 的 数据 ， 而 是 加 到 各 颜色 成 分 上 ， 并 增 
加 引用 计数 。 这 样 做 可 以 计算 颜色 立方 体 中 当前 节点 之 下 的 颜色 的 平均 值 。 这 么 一 来 ,OctTree 
中 的 叶子 节点 就 可 以 表示 立方 体 中 一 系列 相似 的 颜色 。 

finad 方法 (如 代码 清单 8-26 所 示 ) 使 用 和 insert 方法 相同 的 索引 计算 方法 , 遍历 八 又 树 ， 
以 搜索 匹配 红 、 绿 、 蓝 成 分 的 节点 。fina 方法 有 3 种 退出 情形 。 


(1) 到 达 maxLevel 层 ， 返 回 叶子 节点 中 颜色 信息 的 平均 值 (参见 第 15 行 )。 


(2) 在 小 于 maxLevel 的 层 上 找到 一 个 叶子 节点 (参见 第 9 行 ) 稍 后 会 介绍 ， 只 有 在 精简 树 
之 后 ， 才 会 出 现 这 种 情形 。 
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(3) 路 径 导 向 不 存在 的 子 树 ， 这 是 个 错误 。 
代码 清单 8-26 ”fina 方法 





工 def find(self, r, g, b, level): 

2 if level < self.oTree.maxLevel: 

3 idx = self.computeIndex(r, g, b, level) 

4 if self.children[idx]: 

5 return self.children[idx] .find(r, g, b, level +1) 
6 elif self.count > 0: 

7 return ((self.red // self.count, 

8 self.green // self.count, 


9 self.blue // self.count)) 

10 else: 

1 站 print ("error: No leaf node for this color") 
于 多 else: 

13 return ((self.red // self.count, 

14 self.green // self.count, 

ES self.blue // self.count)) 























otNode 类 的 最 后 一 个 方法 是 merge, 如 代码 清单 8-27 所 示 。merge 方法 允许 父 节点 纳入 所 
有 的 子 节点 ， 从 而 形成 一 个 叶子 节点 。 如 果 还 记得 octTree 的 每 个 父 立方 体 完全 包含 所 有 子 立 
方 体 ,你 就 能 明白 。 合 并 一 组 兄弟 节点 时 ,相当 于 是 给 它们 各 自 代 表 的 颜色 计算 加 权 平 均值 。 既 
然 兄 弟 节 点 在 颜色 立方 体 中 相互 离 得 很 近 ， 那 么 这 个 平均 值 就 可 以 很 好 地 代表 它们 。 图 8-19 描 
绘 了 合并 兄弟 节点 的 过 程 。 
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| 
red: 0 green: 0 blue: 0 red: 0 green: 0 blue: 0 
count: 0 count: 0 
of1121314[516]7 2 
red: 0 green: 0 blue: 0 red: 2814 green: 2891 blue: 4223 
count: 0 count: 25 
0|1|2|3|4|5|617 和 0|1|12|13|4|15|6|7 
Ired: 606 green: 735 blue: 1003 red: 126 green: 113 blue: 166 
Count: 6 count: 1 
01|21314151617 0|11121314151617 
red: 604 green: 737 blue: 1098 red: 1478 green:1306 blue: 1956 
count: 6 count: 12 
0|11|121314151617 0|1|2|1314151617 


























图 8-19 合并 八 又 树 中 的 4 个 叶子 节点 


8-19 给 出 了 4 个 叶子 节点 的 红 、 绿 、 蓝 成 分 , 分 别 是 (101, 122, 167)、(100, 122, 183) 、(123， 
108, 163) 和 (126, 113, 166)。 记 住 ， 这 些 值 不 同 于 图 中 标 出 的 计数 。 注 意 ， 这 4 个 叶子 节点 在 颜色 
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立方 体 中 离 得 很 近 。 由 它们 得 到 的 新 叶子 节点 的 i 是 (112, 115, 168)。 这 个 值 接近 于 4 个 值 的 均 
值 ， 但 更 倾向 于 第 3 个 颜色 元 组 ， 因 为 第 3 个 的 引用 计数 是 12。 


代码 清单 8-27 merge 方法 





工 def merge (self): 

2 for i in self.children: 

3 守 站 

4 if i.count > 0: 

5 self.oTree.leafList.remove(i) 
6 self.oTree.numLeaves -= 1 

7 else: 

8 print ("Recursively Merging non-leaf ...") 
9 i.merge() 

10 self.count += i.count 

11 self.red += i.red 

这 self.green += i.green 

3 self.blue += i.blue 

14 for i in range(8): 

15 self.children[i] = None 





因为 octTree 只 使 用 呈现 在 图 片 中 的 颜色 ， 并 且 忠 实地 保留 了 常用 的 颜色 ， 所 以 量化 后 的 
图 片 在 质量 上 要 比 本 节 开 头 的 简单 方法 得 到 的 图 片 高 得 多 。 图 8-20 是 原始 图 片 和 量化 图 片 的 对 比 。 
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(a) 量化 前 (b) 量化 后 
图 8-20 ”比较 原始 图 片 和 利用 octTree 量化 的 图 片 


还 有 很 多 其 他 的 图 片 压 缩 算 法 ， 比 如 游程 编码 、 离 散 余弦 变换 、 霍 夫 受 编码 等 。 理 解 这 些 算 
法 并 不 难 , 希望 你 能 查找 相关 资料 并 了 解 它们 。 男 外 ， 可 以 通过 抖动 这 一 技巧 完善 量化 图 片 。 拌 
动 是 指 将 不 同 的 颜色 靠近 , 让 眼睛 混合 这 些 颜 色 , 形成 一 张 更 真实 的 图 片 。 这 是 报纸 惯用 的 老 把 
戏 ， 通过 黑色 加 上 男 3 种 颜色 实现 彩色 印刷 。 你 可 以 自行 研究 拌 动 的 原理 ， 并 使 它 为 你 所 用 。 


8.6 复习 图 : 模式 匹配 


尽管 计算 机 图 形 学 越 来 越 受 重视 , 但 是 文字 信息 处 理 依然 是 重要 的 研究 领域 , 特别 是 在 长 字 
符 串 中 寻找 模式 。 这 种 模式 常 被 称 作 子 串 。 为 了 找到 模式 ,会 进行 某 种 搜索 ， 至 少 要 能 找到 模式 
首次 出 现 的 位 置 。 我 们 也 可 以 想 想 这 个 问题 的 扩展 版 本 ， 即 如 何 找 到 模式 出 现 的 所 有 位 置 。 
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Python 有 一 个 内 置 的 fina 方法 ， 可 用 于 在 给 定 字符 串 的 情况 下 返回 模式 首次 出 现 的 位 置 ， 
如 下 所 示 。 


>>> "ccabababcab".find("ab") 
>>> "ccabababcab".fingd("xyz") 
-1 


子 串 ab 第 一 次 出 现在 字符 串 ccabababcap 的 位 置 2 处。 如 果 模 式 没有 出 现 ， 会 返回 -1。 
8.6.1 生物 学 字符 串 


生物 信息 学 领域 正在 孕育 一 些 激动 人 心 的 算法 , 特别 是 如 何 管理 和 处 理 大 量 的 生物 数据 。 这 
些 数据 中 有 很 多 是 以 编码 遗传 物质 的 形式 存储 于 染色 体 中 的 。 脱 氧 核糖 核酸 (以 下 简称 DNA ) 
为 蛋白 质 合成 提供 了 蓝图 。 

DNA 基本 上 是 由 4 种 碱 基 构成 的 长 序列 ， 这 4 种 碱 基 分 别 是 腺 味 叭 (A )、 胸 腺 喀 啶 CT 站 
鸟 味 叭 (G ) 和 胞 喀 啶 〈C )。 以 上 4 个 字母 常 被 称 作 “基因 字母 表 ”， 一 段 DNA 就 表示 为 由 这 4 
个 字母 组 成 的 序列 。 比如, DNA 串 ATCGTAGAGTCAGTAGAGACTADTGGTACGA 编码 了 DNA 
的 一 小 部 分 。 这 些 长 长 的 字符 串 可 能 包含 数 以 百 万 计 的 “基因 字母 "”， 其 中 某 些 小 段 为 基因 编码 
提供 了 丰富 的 信息 。 可 见 ， 对 于 生物 信息 学 研究 人 员 来 说 ， 掌 握 找 到 这 些小 段 的 方法 非常 重要 。 

现在 ， 问 题 得 以 简化 : 给 定 一 个 由 A、T、G、C 组 成 的 字符 串 ， 开 发 出 能 定位 某 个 特定 模 
式 的 算法 。 我 们 常常 称 DNA 串 为 “文本 ”。 如 果 模 式 不 存在 , 我 们 也 希望 能 通过 算法 知道 。 此 外 ， 
由 于 这 些 字 符 串 往往 很 长 ， 因 此 需要 保证 算法 的 效率 。 


8.6.2 简单 比较 


要 解决 DNA 串 的 模式 匹配 问题 ， 你 可 能 立刻 会 想到 直接 尝试 匹配 模式 和 文本 的 所 有 可 能 。 
图 8-21 展示 了 这 一 算法 的 原理 。 我 们 从 左 往 右 ， 挨 个 比较 文本 和 模式 的 字母 。 如 果 当 前 字母 匹 
配 ， 就 比较 下 一 个 。 如 果 字 母 不 匹配 ， 将 模式 往 右 滑动 一 个 位 置 ， 重 新 开始 比较 。 
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图 8-21 简单 的 模式 匹配 算法 
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本 例 中 ,我 们 在 第 6 次 尝试 时 发 现 字 母 匹配 ， 此 时 位 于 位 置 5 处 。 币 阴影 的 字母 表示 在 移动 
模式 的 过 程 中 有 部 分 字母 匹配 。 代 码 清单 8-28 给 出 了 这 种 算法 的 Python 实现 。 以 模式 和 文本 为 














在 文本 中 的 起 始 位 置 ; 如 











匹配 失败 ， 则 返回 -1 。 








的 起 点 


ji 


1 # 向 右 移 动 


参数 ， 如 果 发 现 模式 匹配 ， 就 返回 子 中 
代码 清单 8-28 ”简单 的 模式 匹配 器 
4 def simpleMatcher (pattern, text): 
2 startd. sO # 记录 每 次 尝试 
3 EU # 文本 的 下 标 
4 j= 0 # 模式 的 下 标 
5S match = False 

6 stop = False 

水 while not match andq not stop: 
8 if text[i] == patternltl 
9 TS 

10 5 

11 else: 

1 人 2 starti es Starti 注 
43 i = starti 

14 下 全 “0 

15 

16 if j == len(pattern): 
lg match = True 

18 else: 

19 if' 1 ss len(text):: 
20 sto Ss: TTS 

之 灿 

22 if match: 

23 return i-j 

24 else: 

25 return -1 











变量 i 和 j 分 别 作为 文本 和 模式 的 下 标 。starti 记录 每 次 匹配 尝试 的 起 始 位 置 。 两 个 布尔 
型 变量 控制 匹配 终止 的 两 个 条 件 。 穷 尽 文本 而 不 得 时 , 设 stop 为 True。 匹 配 成 功 时 , 设 match 





为 Trueo 











第 8 行 检 查 文 本 中 当前 的 字母 是 否 与 模式 中 当前 的 字母 匹配 。 如 果 匹 配 ， 两 个 下 标 都 递增 ; 
如 果 不 匹 配 ， 则 移动 到 文本 中 下 一 个 位 置 ， 将 模式 重 置 到 起 始 位 置 (第 13 行 ) 第 16 行 检查 是 
和 否 已 经 处 理 完 模式 中 的 所 有 字母 。 如 果 是 ， 就 说 明 匹 配 成 功 ; 如 果 不 是 ， 需 要 检查 文本 中 是 否 还 
有 字母 (第 19 行 )。 
























































假设 文本 长 度 为 上， 模式 长 度 为 m。 很 容易 看 出 ， 这 个 算法 的 时 间 复 杂 度 是 O(nm) 。 对 于 n 
个 字母 中 的 每 一 个 ， 都 可 能 需要 比较 模式 中 的 全 部 字母 (m 个 )。 如 果 n 和 m 比较 小 ， 这 个 算法 


的 效率 尚 可 , 但 是 考虑 到 文本 中 有 数 以 千 计 一 一 其 至 数 以 百 万 计 

















模式 ， 寻 找 更 好 的 算法 就 显得 很 有 必要 。 





的 字母 , 并 且 要 找到 更 大 的 
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8.6.3 使 用 图 : DFA 


如 果 对 模式 做 一 些 预 处 理 ， 就 可 以 创建 时 间 复 杂 度 为 O(n) 的 模式 匹配 器 。 一 种 做 法 是 用 图 
来 表示 模式 ， 从 而 构建 确定 有 限 状 态 自动 机 ， 或 称 DFA。 在 DFA 图 中 ， 每 个 顶点 是 一 个 状态 ， 
用 于 记录 匹配 成 功 的 模式 数 。 图 中 每 一 条 边 代 表 处 理 文本 中 的 一 个 字母 后 发 生 的 转变 。 

8-22 展示 了 前 一 节 中 的 示例 模式 (ACATA ) 的 DFA。 第 一 个 顶点 (状态 0 ) 是 起 始 状态 
(或 称 初始 状态 )， 表 示 还 没有 发 现任 何 匹配 的 字母 。 显 然 , 在 处 理 文本 中 的 第 一 个 字母 之 前 ， 就 


是 这 个 状态 。 






































start 








C GT 
图 8-22 ”确定 有 限 状态 自动 机 











DFA 的 原理 很 简单 。 记 录 当 前 状态 ， 并 在 一 开始 时 将 其 设 为 0。 读 入 文本 中 的 下 一 个 字母 。 
根据 这 个 字母 ， 相 应 地 转变 为 下 一 个 状态 ， 并 将 它 作 为 新 的 当前 状态 。 由 定义 可 知 ， 对 于 每 个 字 
母 ， 每 个 状态 有 且 只 有 一 种 转变 。 这 意味 着 对 于 基因 字母 表 ， 每 个 状态 可 能 有 4 种 转变 。 在 图 
8-22 中 ， 我 们 在 某 些 边 上 标 出 了 多 个 字母 ， 这 是 为 了 表示 到 同一 个 状态 的 多 种 转变 。 

重复 上 述 做 法 ,直到 终止 。 如 果 进 入 最 终 状态 ( DFA 图 用 两 个 同心 圆 表示 最 终 状态 ,本 例 中 
为 状态 5 )， 就 可 以 停 下 来 ， 并 报告 匹配 成 功 。 也 就 是 说 ，DFA 图 发 现 了 模式 的 一 次 出 现 。 你 可 
能 注意 到 ,最 终 状态 不 能 转变 为 其 他 状态 ,也 即 必须 在 此 停 下 来 。 模式 的 出 现 位 置 可 以 根据 当前 
字母 的 位 置 与 模式 的 长 度 计 算出 来 。 男 一 方面 ， 如 果 当 穷尽 文本 中 的 字母 时 处 于 非 最 终 状 态 , 我 
们 就 知道 模式 没有 出 现 。 

图 8-23 逐步 展示 了 在 文本 字符 串 ACGACACATA 中 寻找 子 串 ACATA 的 过 程 。 DFA 计算 出 的 下 
一 个 状态 就 是 下 一 步 的 当前 状态 。 对 于 由 当前 状态 和 当前 字母 组 成 的 每 个 组 合 , 下 一 个 状态 都 是 
唯一 的 ， 因 此 这 个 DFA 图 并 不 复杂 。 
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图 8-23 ”逐步 分 析 DFA 模式 匹配 髓 


因为 文本 中 的 每 个 字母 都 作为 DFA 图 的 输入 被 使 用 一 次 ， 所 以 这 种 算法 的 时 间 复 杂 度 是 
O(n) 。 不 过 ， 还 需要 考虑 构建 DFA 的 预 处 理 步 骤 。 有 很 多 知名 算法 可 以 根据 模式 生成 DFA 图 。 





























问题 就 来 了 ， 是 否 有 类 似 的 模式 匹配 器 ， 但 它 的 边 集 合 更 简单 ? 
8.6.4 使 用 图 : KMP 


8.6.2 节 中 的 模式 匹配 器 将 文本 中 的 每 个 可 能 匹配 成 功 的 子 串 都 与 模式 比较 。 这 样 做 往往 是 
在 浪费 时 间 ,， 因 为 匹配 的 实际 起 点 远 在 之 后 。 一 种 改善 措施 是 ， 如果 不 匹配 ， 就 以 多 于 一 个 字母 
的 幅度 滑动 模式 。 图 8-24 展示 了 这 种 策略 ， 将 模式 滑 到 前 一 次 发 生 不 匹配 的 位 置 。 


























A 与 G 不 匹配 ， 因 此 滑动 2 个 位 置 
A 与 G 不 匹配 ， 因 此 清 动 1 个 位 置 
T 与 C 不 此 配 ， 因 此 滑动 3 个 位 置 
太 远 了 


上 Wi 一 


风 





8-24 滑动 幅度 更 大 的 模式 匹配 器 


第 1 步 ， 我 们 发 现 前 两 个 位 置 是 匹配 的 。 不 匹配 的 是 第 3 个 字母 ( 图 中 带 阴影 的 字母 )， 将 
整个 模式 滑 过 来 ,下 一 次 尝试 从 这 一 点 开始 。 第 2 步 , 一 上 来 就 不 匹配 , 没有 其 他 选择 ， 只 能 滑 
动 到 下 一 个 位 置 。 此 时 ,我 们 发 现 前 3 个 字母 是 匹配 的 。 但 有 个 问题 : 不 匹配 时 , 算法 根据 策略 
把 模式 滑 到 某 个 位 置 ; 但 这 样 做 就 请 过 头 了 , 也 就 是 漏 掉 了 模式 在 文本 串 中 真正 的 起 点 ( 位置 5 )。 
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这 个 方案 失败 的 原因 在 于 ， 没 有 利用 前 一 次 不 匹配 时 模式 和 文本 的 内 容 信息 。 在 第 2 步 中 ， 
文本 串 的 最 后 2 个 字母 (位置 5 和 位 置 6) 实际 上 是 和 模式 的 前 2 个 字母 匹配 的 。 我 们 称 这 种 情 
况 为 模式 的 两 字母 前 缀 与 文本 串 的 两 字母 后 组 匹配 。 这 条 信息 很 有 价值 。 如 果 记 录 下 前 缀 和 后 绥 
的 重 又 情况， 就 可 以 直接 将 模式 滑动 到 正确 位 置 。 

基于 上 述 思路 ， 可 以 构建 名 为 KMP (Knuth-Morris-Pratt ) 的 模式 匹配 器 ， 它 以 提出 这 一 算 
法 的 3 位 计算 机 科学 家 的 姓氏 命名 。KMP 算法 的 思想 就 是 构建 图 ， 在 字母 不 匹配 时 可 以 提供 关 
于 “滑动 ”距离 的 必要 信息 。KMP 图 也 由 状态 (顶点) 和 转变 ( 边 ) 构成 。 但 不 同 于 DFA 图 ， 
KMP 图 的 每 个 顶点 只 有 2 条 向 外 的 边 。 


8-25 是 示例 模式 的 KMP 图 , 其 中 有 两 个 特殊 的 状态 。 初 始 状 态 ( 标 有 get 的 顶点 ) 负责 
从 输入 文本 中 读 入 下 一 个 字母 。 随 后 的 转变 ( 标 有 星 号 的 边 ) 是 肯定 发 生 的 。 注 意 ， 一 开始 从 文 
本 读 入 前 两 个 字母 ， 然 后 立即 转 到 下 一 个 状态 (状态 1 ),。 最 终 状 态 ( 状态 6, 标 有 F 的 顶点 ) 表 
示 匹 配 成 功 ， 它 对 于 图 来 说 是 终点 。 













































































图 8-25 KMP 图 示例 


其 他 顶点 负责 比较 模式 中 的 每 个 字母 与 文本 中 当前 的 字母 。 例 如 ， 标 有 c? 的 顶点 检查 文本 




















中 当前 的 字母 是 否 为 C。 如 果 是 ， 就 选择 标 有 Y 的 边 〈Y 代表 yes, 说 明 匹 配 成 功 )， 同 时 读 人 下 
一 个 字母 。 无 论 是 否 匹 配 成 功 ， 都 会 从 文本 中 读 人 下 一 个 字母 。 

标 有 N 的 边 表示 不 匹配 。 前 面 解释 过 ， 遇 到 这 种 情况 时 ， 要 知道 滑动 多 少 个 位 置 。 本 质 上 ， 
我 们 是 要 记录 文本 中 当前 的 字母 , 并 且 往 回 移动 到 模式 中 的 前 一 个 点 。 为 了 计算 , 我 们 采用 一 个 
简单 的 算法 ( 如 代码 清单 8-29 所 示 )， 比 较 模式 与 其 自身 ， 找 出 前 缀 和 后 级 的 重 益 部分。 由 重 闭 
部 分 的 长 度 可 知 要 往 后 挪 多 远 。 注 意 ， 使 用 不 匹配 链接 时 ， 不 处 理 新 的 字母 。 


代码 清单 8-29 mismatchLinks 方法 























出 def mismatchLinks (pattern): 

2 augPattern = "0"+pattern 

3 links = {} 

4 Tinks TL] 0 

5 for k in range(2, len(augPattern)): 
6 s = links[k-1] 

7 stop = False 

8 while s>=1 and not stop: 
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9 if augPattern[s] == augPattern[k-1]: 
10 stop = True 

二 下 else: 

2 s = links[s] 

3 links[k] = s +1 

14 return links 

















来 看 通过 mismatchLinks 方法 处 理 模式 的 例子 。 
>>> mismatchLinks ("ACATA") 
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这 个 方法 会 返回 一 个 字典 ， 其 中 的 键 是 当前 的 顶点 ( 状态 )， 值 是 不 匹配 链接 的 终点 。 可 以 
看 出 , 从 1 到 5 的 每 个 状态 分 别 对 应 模式 中 的 每 个 字母 ， 并 且 每 个 状态 都 有 回 到 之 前 某 个 状态 的 
一 条 边 。 

前 面 提 过 , 不 匹配 链接 可 以 通过 滑动 模式 并 寻找 最 长 的 匹配 前 级 和 匹配 后 缀 得 到 。 这 个 方法 
先 扩 展 模式 ， 让 模式 中 的 下 标 对 得 上 KMP 图 中 的 顶点 标签 。 既 然 初始 状态 是 状态 0， 就 将 0 作 
为 扩展 位 上 的 占 位 符 。 这 样 一 来 ,模式 中 的 第 1~m 个 字母 就 分 别 对 应 KMP 图 中 的 第 1~m 个 状态 。 

第 5 行 创建 字典 的 第 一 项 , 这 一 项 总 是 从 顶点 1 回 到 初始 状态 的 一 条 边 ， 从 文本 串 中 自动 读 
入 一 个 新 字母 。 之 后 的 循环 一 步 步 扩大 模式 的 检查 范围 ， 寻找 前 级 和 后 级 的 重 辣 部 分 。 如 果 有 重 
车 ,其 长 度 可 以 用 来 设置 下 一 个 链接 。 

8-26 逐步 展示 了 在 文本 字符 串 AcGACACATA 中 寻找 示例 模式 的 过 程 。 再 次 注意 ， 只 有 在 
使 用 匹配 链接 后 ， 当 前 字母 才 会 变化 。 不 匹配 时 ， 当 前 字母 不 变 ， 比 如 第 4 步 和 第 5 步 。 第 6 步 
转变 回 状态 0， 读 人 下 一 个 字母 ， 返 回 状态 1。 





















































































































































步 台 当前 状态 be i 
1 0 A 1 动 转变 
2 1 A 2 状态 1 匹配 ， 获 取 下 一 个 
3 2 C 3 状态 2 匹配 ， 获 取 下 一 个 
4 3 G 1 不 匹配 
5 1 G 0 不 匹配 
6 0 A 1 动 转变 
7 1 A 2 
8 2 C 3 
9 3 A 4 
10 4 C 2 不 匹配 
11 2 C 3 犬 态 2 匹配 
12 3 A 4 
13 4 T 5 
14 5 A F 匹配 成 功 
图 8-26 ”逐步 分 析 KMP 模式 匹配 器 
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第 10 步 和 第 11 步 体 现 了 不 匹配 链接 的 重要 性 。 第 10 步 中 当前 的 字母 是 C， 它 与 状态 4 需 
要 匹配 的 字母 不 符 ， 因 此 结果 是 一 个 不 匹配 链接 。 不 过 ， 既 然 此 时 发 现 部 分 字母 匹配 ,那么 这 个 
不 匹配 链接 就 回 到 了 正确 匹配 的 状态 2。 正 因为 如 此 ， 最 终 才 匹配 成 功 。 

和 DFA 算法 一 样 ,KMP 算法 的 时 间 复 杂 度 也 是 O(n) , 因为 要 处 理 文本 字符 串 中 的 每 个 字母 。 
不 过 ，KMP 图 构建 起 来 要 容易 得 多 ， 而 且 所 需 的 存储 空间 也 少 ， 每 个 顶点 只 有 2 条 向 外 的 边 。 









































8.7 小 结 


口 映射 (字典 ) 是 关联 形式 的 内 存 结构 。 

口 跳 表 是 可 以 提供 O(logn) 搜索 的 链表 。 

口 八 又 树 可 以 高 效 地 精简 表示 图 片 时 所 需 的 颜色 数量 。 
口 基于 文本 的 模式 匹配 是 很 多 应 用 领域 常见 的 问题 。 
口 简单 的 模式 匹配 效率 很 低 。 

口 DFA 图 易于 使 用 ,但 不 易 构 建 。 

口 KMP 图 既 易 于 使 用 ， 也 易于 构建 。 


8.8 ”关键 术语 

















DFA 图 DNA 串 KMP KMP 图 

RSA 算 法  ” 八 又 树 层 数 拌 动 

公 钥 加 密 均 摊 分 析 ”量化 确定 有 限 状 态 自 动机 (DFA ) 
塔 跳 表 像素 映射 

子 串 字典 


8.9 讨论 题 

跳 表 的 名 字 从 何 而 来 ? 

比较 跳 表 与 完全 平衡 的 二 叉 搜索 树 。 你 能 画图 描述 这 两 个 概念 么 ? 

如 果 跳 表 中 所 有 塔 的 高 度 都 为 1， 意味 着 什么 ? 

给 定 20 个 键 ， 是 否 可 能 有 塔 的 高 度 达到 20? 

选择 一 张 图 片 , 运行 0ctTree 的 量化 程序 。 尝试 设置 不 同 的 最 大 树 高 与 最 终 的 色彩 数 。 
解释 为 什么 octTree 节点 的 计算 顺序 是 从 最 高 有 效 位 到 最 低 有 效 位 。 

插入 (174, 145, 229) 和 (92, 145, 85) 两 种 颜色 后 ， 画 出 octTree 从 顶层 到 第 5 层 的 节点 。 
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8， 夯 出 模式 ATC 的 DFA 图 。 
9. 计算 模式 ATC 的 不 匹配 链接 。 
10， 为 模式 ATCCAT 创建 KMP 图 。 


8.10 ”编程 练习 
1. 实现 ArrayList 类 的 下 列 方法 ， 并 分 析 它 们 的 性 能 。 
Dael: 删除 列表 中 给 定位 置 上 的 元 素 。 
口 bop: 实现 弹出 方法 ， 包 括 带 参数 和 不 带 参 数 两 个 版 本 。 
D index: 在 ArrayList 中 搜索 给 定 的 值 。 若 找到 ， 返 回 它 在 列表 中 的 位 置 ， 否 则 返 
回 -1。 
口 让 ArrayList 可 迭代 。 
2. ”Python 列表 支持 连接 和 重复 。 让 ArrayList 支持 + 和 * 运 算 。 
3. 为 跳 表 实现 aelete 方法 。 可 以 假设 键 存在 。 
4. 为 跳 表 实现 方法 ， 让 映射 支持 下 列 操作 。 
口 __contains__() 返 回 一 个 布尔 值 ， 用 于 说 明 键 是 否 存 在 于 映射 中 。 
口 keys () 返 回 映 射 中 键 的 列表 。 
口 values () 返 回 映射 中 值 的 列表 。 


5. 为 跳 表 实现 ”getItem 方法 和 ”setItem 方法 。 

6. ”修改 octTree 类 , 使 用 更 高 效 的 数据 结构 记录 叶子 节点 , 以 改善 reduce 方法 的 性 能 。 

7. 为 octTree 类 增加 两 个 方法 ， 一 个 用 于 将 量化 图 片 写 人 磁盘 文件 ， 另 一 个 用 于 以 你 所 
写 的 格式 读 取 文件 。 

8. 有 些 版 本 的 量化 算法 会 查看 某 个 节点 的 子 节点 总 数 ， 并 用 这 一 信息 决定 精简 哪些 节点 。 
修改 octTree 的 实现 ， 在 精简 树 时 使 用 这 个 方法 选择 节点 。 

9. 实现 一 个 简单 的 模式 匹配 器 ， 用 于 定位 模式 在 文本 中 出 现 的 所 有 位 置 。 

10， 修 改 第 7 章 中 的 图 实现 , 以 支持 对 KMP 图 的 表示 。 使 用 mi smatchLinks 写 一 个 方法 ， 
根据 模式 创建 完整 的 KMP 图 。 有 了 图 后 ， 写 一 个 程序 ， 对 这 个 KMP 图 运行 任意 文本 ， 
返回 匹配 是 否 存在 。 










































































Python 图 形 包 





























有 很 多 非常 好 的 图 形 包 ， 它 们 或 是 已 经 包含 在 Python 内 ， 或 是 可 以 自由 下 载 。 以 下 是 其 中 
的 几 个 。 
VPython 是 一 个 很 好 用 的 3D Python 扩展 包 ， 被 很 多 物理 学 老师 使 用 。 


graphics.py 由 John Zelle 提供 ， 他 的 本 意 是 与 其 著作 Python Programming: An Introduction to 
Computer Science 配套 使 用 。 

Tkinter 是 广泛 使 用 的 图 形 组 件 集 。 有 了 Tkinter, 你 就 可 以 用 美观 的 按钮 等 组 件 搭建 用 户 界 面 。 

turtle graphics 是 可 以 从 互联 网 上 免费 获取 的 图 形 包 ， 用 这 些 包 绘制 递归 图 形 时 格外 有 趣 。 
Python 3.2 中 的 turtle 模块 已 经 相当 完善 ， 也 很 好 用 。 

wxPython 是 跨 平台 的 图 形 用 户 界面 工具 包 。 用 wxPython 写 的 图 形 程序 可 以 在 任何 装 有 该 工 
有 具 包 的 计算 机 上 运行 。 

PyOpenGL: 如 果 你 熟悉 OpenGL， 那 么 PyOpenGL 包 会 让 你 如 席 添 辟 。 




































































Python 资源 








若 想 进一步 学 习 Python， 以 下 是 可 供 参考 的 网 站 和 书 。 

www.python.org: 关于 Python 内 容 的 优秀 资源 。 

Python Programming in Context， 由 Bradley N. Miller 和 David L. Ranum 合 著 。 
Python Programming: An Introduction to Computer Science， 作 者 是 John Zelle。 
Learning Python (2nd Edition)， 由 Mark Lutz 和 David Ascher 合 著 。 


Adleman, L., Rivest, R. L., Shamir, A. (1978). A method for obtaining digital signatures and public-key 
cryptosystems. Communications of the ACM. 


Bellman, R. (1952). On the theory of dynamic programming. Proceedings of the National Academy of Science, 
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